Нейросеть обучаешь?
Пока тестирую для одного сайта о котором нельзя говорить
Отправлено 15 Август 2017 - 17:08
Да норм у тебя все получается. Главное идти к цели.
Ты через библиотеку PHP распознаешь?
Нет. PHP тут не задействован.
Внутренности сайта, код капчи или ссылки не трогаю. Не трогаю вообще ничего.
Код может поменяться и скрипт слетит. Ссылка может поменяться и скрипт слетит.
Я пошел по иному пути. Скрипт перестанет работать тогда, когда гулг вообще поменяет принцип recaptcha от той, что есть сегодня.
Отобразилась капча, показала мне картинки, вот их и смотрю скриптом.
Отправлено 15 Август 2017 - 17:26
Да норм у тебя все получается. Главное идти к цели.
Ты через библиотеку PHP распознаешь?
Нет.
Внутренности сайта, код капчи или ссылки не трогаю. Не трогаю вообще ничего.
Код может поменяться и скрипт слетит. Ссылка может поменяться и скрипт слетит.
Я пошел по иному пути. Скрипт перестанет работать тогда, когда гулг вообще поменяет принцип recaptcha от той, что есть сегодня.
Отобразилась капча, показала мне картинки, вот их и смотрю скриптом.
Ну я ж всей кухни не знаю. Но результаты довольно обнадеживающие
А на чистой капче пробовал? (не всплывающей)
образование позволяет зарабатывать на хлеб, самообразование на масло, сыр и даже икру
Отправлено 15 Август 2017 - 18:23
Да норм у тебя все получается. Главное идти к цели.
Ты через библиотеку PHP распознаешь?
Нет.
Внутренности сайта, код капчи или ссылки не трогаю. Не трогаю вообще ничего.
Код может поменяться и скрипт слетит. Ссылка может поменяться и скрипт слетит.
Я пошел по иному пути. Скрипт перестанет работать тогда, когда гулг вообще поменяет принцип recaptcha от той, что есть сегодня.
Отобразилась капча, показала мне картинки, вот их и смотрю скриптом.
Ну я ж всей кухни не знаю. Но результаты довольно обнадеживающие
А на чистой капче пробовал? (не всплывающей)
Пройти всплывающую капчу проблем не возникнет. Главное научить скрипт распознавать. Я пока начал с дорожных знаков, потому как они мне показались самыми легкими для распознавания и чаще встречающими. Автомобили, мосты и дома - будет сложней научить скрипт их понимать.
Я начал писать скрипт от чистого любопытства, получится или нет... Если будет получатся, то интерес больший будет)))
Потому и выложил промежуточные результаты, чтоб услышать Ваше мнение, стоит продолжать или нет.
Отправлено 16 Август 2017 - 05:58
https://djoser-blog....ge-4#entry22429
пункт 5,
на практике оказалось этого мало, и сложно, со временем я придумал функцию COMPRESS_SHADES которая сжимает количество оттенков с двух миллионов до двух тысяч кажется, или меньше, не помню, но еще меньше уменьшать точно не вариант, процесс упростился, но для полной картины нужно поделить оставшиеся оттенки по сегментам, тоесть, оттенки красного к красному, синего к синему и тд, и второе что нужно, это написать алгоритм который исходя из точек должен понять что это за фигура, круг, треугольник, прямоугольник, или какое-то расплывчатое гавно, после уже по логике можно будет отобрать нужные квадраты, сейчас у меня времени нет этим заниматься, начну уже с сентября, но эсли тебе хватит ума придумать подобные алгоритмы то будет супер, ускоришь процесс распознания.
=======================================================
============Для доната miniPoster P28909803===============
=======================================================
=======================================================
= ОФИЦИАЛЬНЫЙ DISCORD КАНАЛ -- https://discord.gg/68xNQxy ==
=======================================================
Отправлено 16 Август 2017 - 09:00
https://djoser-blog....ge-4#entry22429
пункт 5,
на практике оказалось этого мало, и сложно, со временем я придумал функцию COMPRESS_SHADES которая сжимает количество оттенков с двух миллионов до двух тысяч кажется, или меньше, не помню, но еще меньше уменьшать точно не вариант, процесс упростился, но для полной картины нужно поделить оставшиеся оттенки по сегментам, тоесть, оттенки красного к красному, синего к синему и тд, и второе что нужно, это написать алгоритм который исходя из точек должен понять что это за фигура, круг, треугольник, прямоугольник, или какое-то расплывчатое гавно, после уже по логике можно будет отобрать нужные квадраты, сейчас у меня времени нет этим заниматься, начну уже с сентября, но эсли тебе хватит ума придумать подобные алгоритмы то будет супер, ускоришь процесс распознания.
У меня по сути сейчас алгоритм и базируется на, как ты называешь COMPRESS_SHADES и сталкиваюсь с проблемами( Чем меньшая вариация, тем больше пиксель становиться уникальным. Большая вариация - меньшая уникальность. Но проблема в том, чем больше вариация, тем больше появляется шума и идет ложное срабатывание( А гугл не дурак. На задних планах может быть красная машина или какой-то кирпич или тряпка и скрипт думает, что там находится то, что ищем. А больше всего бесит эффект свечения. Этот эффект жестко сбивает распознавание. Это как кирпичом по голове при реллаксе)))) Можно сделать вариацию 0, но пикселей нужно ого-го, пару сотен тисяч и распознавать такую капчу будет часа два) Подумать страшно прогнать 100к пикселей 16 раз. Немного успокаивает то, что можно сделать много потоков, но все равно базу пикселей нужно уменьшать раз в 10.
Отправлено 16 Август 2017 - 09:23
Задумка хорошая, но прогресс сомнителен..
Только по тому что капча должна быть "идеальной".. судя по скринам.
Видимо вы в ручную их мало порешали, да бы убедится на сколько таких мало.
Про многостраничные вообще наверно можно забыть, так как после первой ошибки гугл вообще нагнёт.
Отправлено 16 Август 2017 - 10:02
Задумка хорошая, но прогресс сомнителен..
Только по тому что капча должна быть "идеальной".. судя по скринам.
Видимо вы в ручную их мало порешали, да бы убедится на сколько таких мало.
Про многостраничные вообще наверно можно забыть, так как после первой ошибки гугл вообще нагнёт.
Вы правы, вручную я их мало решал. А то, что гугл загибает после ошибок - то это точно. Уже прочувствовал)))
Отправлено 16 Август 2017 - 12:41
https://djoser-blog....ge-4#entry22429
пункт 5,
на практике оказалось этого мало, и сложно, со временем я придумал функцию COMPRESS_SHADES которая сжимает количество оттенков с двух миллионов до двух тысяч кажется, или меньше, не помню, но еще меньше уменьшать точно не вариант, процесс упростился, но для полной картины нужно поделить оставшиеся оттенки по сегментам, тоесть, оттенки красного к красному, синего к синему и тд, и второе что нужно, это написать алгоритм который исходя из точек должен понять что это за фигура, круг, треугольник, прямоугольник, или какое-то расплывчатое гавно, после уже по логике можно будет отобрать нужные квадраты, сейчас у меня времени нет этим заниматься, начну уже с сентября, но эсли тебе хватит ума придумать подобные алгоритмы то будет супер, ускоришь процесс распознания.
У меня по сути сейчас алгоритм и базируется на, как ты называешь COMPRESS_SHADES и сталкиваюсь с проблемами( Чем меньшая вариация, тем больше пиксель становиться уникальным. Большая вариация - меньшая уникальность. Но проблема в том, чем больше вариация, тем больше появляется шума и идет ложное срабатывание( А гугл не дурак. На задних планах может быть красная машина или какой-то кирпич или тряпка и скрипт думает, что там находится то, что ищем. А больше всего бесит эффект свечения. Этот эффект жестко сбивает распознавание. Это как кирпичом по голове при реллаксе)))) Можно сделать вариацию 0, но пикселей нужно ого-го, пару сотен тисяч и распознавать такую капчу будет часа два) Подумать страшно прогнать 100к пикселей 16 раз. Немного успокаивает то, что можно сделать много потоков, но все равно базу пикселей нужно уменьшать раз в 10.
для этого я и говорю про то что нужен алгоритм который по точкам определит геометрическую фигуру, ты часто например всречаешь круглую или овальную красную машину? - нет, или красный прямоугольный знак? - нет, гугл тоже тупой, он работает по тому же принципу, он за знаки выдает плакаты и бигборды.
=======================================================
============Для доната miniPoster P28909803===============
=======================================================
=======================================================
= ОФИЦИАЛЬНЫЙ DISCORD КАНАЛ -- https://discord.gg/68xNQxy ==
=======================================================
Отправлено 17 Август 2017 - 06:34
Да, согласен, раз автор темы затронул тему распознавания рекапчи по, некому неизвестному методу, добавлю свою лепту... Джо замутил МП, в котором все знаки превращаются в фигуры. Замути, попробуй, распознавать фигуры на картинке...
Я смотрю, твой метод работает по оттенкам, но он уже проверен, если сможешь сделать распознавание фигур (треугольники, квадраты, ромбы и прочее), тебе цены не будет...))))
0 пользователей, 0 гостей, 0 анонимных