Думаю, каждый, кто хоть сколько-нибудь заглянул за завесу, отделяющую манимейкинг от обывателя знает, что такое капча и зачем она нужна. Прогоны по закладкам, каталогам, регистрация профилей, спам и т.п. – самому вводить сотни генерированных капч представляется просто физически невозможным. И каждый, наверное, пользовался спец. сервисами по автоматическому вводу капч. И многие знают, что по ту сторону сидят такие же люди, которые за копейки вбивают по 800 капч в час. Но остальные аспекты этой индустриии традиционно покрыты мраком и доподлино о ней мало что известно. Попробуем заглянуть по-глубже.
Сам термин CAPTCHA расшифровывается, как “Completely Automated Public Turing test to tell Computers and Humans Apart” (полностью автоматизированный публичный тест Тюринга для разделения компьютеров и людей). Очевидно, что создан он был для того, чтобы узнавать, кем является пользователь – человеком, либо набором нулей и единиц (ботом, то бишь). Концепция заключается в том, чтобы подсунуть испытуемому задание, которое человек бы выполнил с легкостью, но которое было бы неразрешимым для робота. Капча является одним из основных инструментов для предотвращения массовых регистраций и борьбы со спамом. Видов капчи существует немало, мы еще о них поговорим.
Индия покоряет интернет.
На данный момент в Индии оформилась целая индустрия по вводу капчи. Бизнес процветает, предоставляемая услуга по вводу капчи становится все более актуальной. Армия низкооплачиваемых рабочих официально занята в среде “обработки данных” по цене в 2$ за 1000 правильно введенных капч. На данный момент наблюдаются даже признаки объединения крупнейших индийских компаний, занимающихся массовым распознаванием капчи. Так же осуществляется выдача франшизы зарубежным партнерам, экипированным самопальными наборами по распознаванию CAPTCHA, API и тысячами прокси, облегчающими их работу и повышающими ее качество в разы.
Наем людей, которых потом будут тестировать на проф. пригодность той же самой капчей, главным образом осуществляется посредством подобной рекламы (лично мне сильно напомнило наши школолохотроны):
- Простая работа;
- Образование не имеет значения;
- Не требует вложений;
- Еженедельные выплаты;
- Работа на дому;
- Аболютно свободный и гибкий график;
- Самые высокие расценки в отрасли.
Насколько серьезен бизнес по распознаванию капчи в Индии? Нижеследующие объявления говорят сами за себя – распознавание капчи стало по настоященму коммерчески выгодным занятием и в отрасли наблюдается нехилая конкуренция:
Саппорт 24/7, 30 компьютеров и 90 работников. Выполним проект в кратчайшие сроки. У нас только высокоопытные специалисты!
У нас имеется 10 систем и работники с отличным навыком набора. Мы запросто осиливаем 25 тысяч капч в день.
У меня 40 ПК и 55 человек, работающих в моем офисе и занимающихся вводом данных. 1 работник вбивает 800 капч в час. Я могу гарантировать вам хорошую скорость и качество.
У нас команда, работающая 24/7 и распознающая более 200 тысяч капч в день.
У нас более 10 команд, мы работаем круглосуточно и распознаем более 700 тысяч капч в день.
У меня команда из 7 человек, мы берем 2$ за 1000 введенных капч и распознаем их более 50 тысяч в день.
Вот еще одно объявление, крупная компания набирает персонал:
Для участия в долгосрочном проекте требуются команды, способные работать круглосуточно. Мы ищем команды, способные распознавать от 10 000 до 200 000 кодов в день. Расценки – 1,5$ за 1000 верных кодов. Наши требования: не менее 90% верно введенных кодов и менее 10 секунд на распознание одного. Статистика в реальном времени. Выплаты 3 раза в неделю, через Paypal. Аутсорсинг допустим. Предпочтительны команды, которые могут предоставлять услуги круглосуточно. Не тратьте свое и наше время!
У нас сложная комплексная системы для работы с CAPTCHA, расчитанная на распознание до одного миллиона капч в день. Имеется несколько больших команд и сотни сторонних работников, работающих с CAPTCHA, все одновременно, особенно в дневное время в Индии. Техническая часть проекта включает в себя 45 мощных, дорогих серверов, соединенных с MySpace, чтобы вытягивать из него капчу, доставлять ее нашим работникам и отправлять их ответы обратно на сайт.
Не обходится без проволочек. Самым слабым местом системы является тот факт, что MySpace обычно перегружен, медлителен и обладает набором глюков, что сильно усложняет нам работу. Так же значительная часть работы на серверах выполняется из других стран, так что присутствуют и лаги.
Обычно, когда сервер слишком долго получает с сайта капчу, ему приходится ждать другие наши серверы, чтобы получить новую. Бывает, сотни работников одновременно ожидают, т.к. в работе серверов с сайтом соблюдается строгая очередность.
Несколько скринов интерфейсов капчаводов:
Статсы:
Некоторая справочная информация.
Существующие на данный момент виды капчи:
- Классическая капча. Представляет собой последовательность символов, обычно в искаженном виде;
- “Интеллектуальная” капча. Ответить на вопрос, либо совершить действие, трудновыполнимое для компьютера. Например, посчитать кол-во предметов на картинке, нажать на самый большой объект из предлагаемых, назвать фамилию президента и т.п.;
- Математическая капча. Предлагается совершить некую арифметическую операцию и ввести результат. Сложность варьируется от простого сложения/вычитания чисел до сложных математических уравнений, вычисления пределов и интегралов;
- Re-Captcha. Одна из самых действенных и востребованных систем. В отличии от классической капчи, пользователю предлагается ввести два слова, первое из которых уже известно системе, а второе – нет. Проверка осуществляется по первому коду, а второй сохраняется как возможный вариант распознавания. Конечный вариант определяется с помощью вычисления самого часто используемого варианта написания слова. Отмечают крайне высокую эффективность системы;
- Разработана видео-капча, в которой фон и символы находятся в движении, что делает распознание их компьютером невозможным.
Методы обхода капчи:
- Собственно, самостоятельный ввод;
- Обратиться за услугами к Индийским корпорациям;
- Брутфорс. Если капча предлагает небольшое кол-во варинтов ответов, то скрипт анти-капчи может угадать его простым перебором. Скорость зависит от кол-ва потоков и толщины канала;
- Автоматическое распознавание. Некоторые скрипты обладают возможностью распознавать т.н. “слабую” капчу. Слабой считается капча, символы на которой слабо искажены и/или имеют сильно отличный от фона цвет, картинка недостаточно “зашумлена”, и т.п.;
- Т.н. “метод леммингов”. Рассмотрим на примере: есть сайт, на который заходит пользователь. Робот вытягивает очередную неразгаданную из капчу с нужного ему сервиса и показывает пользователю, предлагая ввести код для доступа на сайт, что он и делает. В итоге все остаются довольны: пользователь получает доступ на сайт, робот – разгаданную капчу. Похоже на метод Индийских Корпораций, но чуть менее этично.
In this country captcha solves you!
Каждый малолетний Российский спаммер знаком с сервисом antigate.com. Первоначально, при подготовке статьи я планировал взять у них небольшое интервью с целью выяснить, как обстоят дела с капчеванием в России. Но, этому не суждено было сбыться, на свою просьбу я получил вот такой вот лаконичный ответ:
К сожалению нам лишнее внимание ни к чему, большинство параметров мы держим в секрете от публики, поэтому помочь ничем не можем.
Оно, в общем-то, понятно, милиция в телевизоре за последние полгода стала очень пристально следить за киберпреступниками. Новый тренд?
И, напоследок, несколько вариантов ультрасложной, тупой, смешной, несмешной и просто интересной капчи:
При подготовке поста использовались: статья Inside India’s CAPTCHA solving economy, Википедия, интернеты.
—-
Извиняюсь за перерыв, в связи с выходом второго старкрафта на несколько суток выпал из жизни.
Я так понимаю, у Вас “интеллектуальная”)))? Наглядные рисунки позволяют понять, что встречается такая каптча, с которой даже бороться не захочешь, просто закрываешь страницу….
Forum
Именно:) В этом пункте я объединил всю “креативную” капчу.
А как же российский сайт http://kolotibablo.com ? он помоему сделал не только индейцев, видел рекламу на китайских сайтах ;)
Резюме распознавателей хороши. Как-то не задумывался что там ещё люди работают, почему-то считл что исключительно скрипты на автомате.
спасибо, интересная статья. Сам когда-то давно на заре своего “бизнеса” в интернет, когда увлекался всякими почтовиками и буксами, вводил капчу аж за 0,005$ и минималке в 1$ был безумно счастлив :D
Этой осенью мы начали работу над новой разновидностью капчи – незаметной для посетителя.
Принцип работы новой капчи заключается в последовательной проверке параметров посетителя как в момент заполнения веб-формы, так и до, и после ее заполнения. Если система посчитает посетителя роботом или спамером, результат его действий будет стерт из буфера (отведенного системой места, куда попадают все данные из веб-форм), если же это человек, данные из буфера будут успешно перенесены в постоянную базу сайта.
Если нам удастся успешно внедрить наш вид капчи, надеемся, что посетителям станет легче жить т.к. со страниц исчезнут вообще какие-либо капчи и процесс заполнения веб-форм станет прозрачным.
Alex Hodinar
Какие люди:) Рад видеть вас на своем бложике.
Думаю, скрипты никогда не смогут дать такой процент правильных распознаний, поэтому дармовая рабочая сила остается актуальной.
Касперский
Насчет буксов и т.п. могу посоветовать вам эту статью. Там про это тоже есть;)
Дмитрий Мелихов
Ого. Первый раз слышу. Инновации? Очень круто.
Только вот меня терзают сомнения по поводу фразы “если система посчитает”: не будет ли процент огрехов слишком большим? Вспоминается всеми любимый Akismet, который еженедельно заносит в спам десяток-другой нормальных комментариев. В любом случае, желаю успехов в разработке.
greencoma
Большое спасибо за пожелания.
Разумеется, это я так выразился в простой форме.
Мы все протестируем и если система себя оправдает, найдем ей применение. В противном случае, разумеется будем думать…
Тем не менее, благодарю за рекомендацию, уделим вопросу о вероятности ложного срабатывания больше внимания.
Дмитрий, только примите во внимание всевозможные заполнители форм, которыми пользуются для (в большинстве случаев) частичного заполнения форм (фамилия, имя, адрес эл. почты). Я сам пользователь LastPass и было бы обидно, если бы меня зарубила невидимая капча… Да, вы могли бы предлагать “подозрительным” подозреваемым “классическую” капчу :)
Николай, большое спасибо за подсказку. Мы обязательно проверим подобные ситуации. Может кто-нибудь подскажет, какие бывали ситуации при заполнении веб-форм? Например, обрыв связи, просроченная сессия, повторная отправка формы? Чем больше мы сможем протестировать подобных ситуаций, тем увереннее будем себя чувствовать во время релиза…
а я думал всем етим занимаються Китайцы :D
Кстати, самое интересно это то, что постепенно мноиге начали возвращаться к самой просто форме антиспама – галочке. Наприме, как и на этом блоге )
С одной стороны правильно, многие спамеры уже и не надеются наткнуться на такую простейшую “защиту”, но что мешает прошаренным людям собрать список таких блогов без модерации комментов и спамить именно по ним?
примеры капч убили =)
Я видел у нас такой же сервис, там вроде по уровням: если ты крутой, вводишь по несколько тысяч в день, то тебе платят больше. Представляет, за рабство ещё и платят )))
Предлагаю работу по вводу капчи.
Тариф 0.8$ за 1000 картинок.
Выплаты через Webmoney.
Пишите: stepacha@yandex.ru.
белый каталог без капчи
http://zonkat.ru а у меня с капчей.
http://zonkat.ru а у меня с капчей
Свежие инвайты для регистрации на httpinternet.net (LookandEarn.biz): 1.7$ ЗА 1000 КАПЧИ
Инвайты:
23e89f7f
24a0ac8a
486c50fd
721659ee
e6d8160b
f8d7f934
12f082ca
16cec63a
Один инвайт – один пользователь. Если инвайт использован, второй раз он не подходит, т.е. как не вводить регистрационные данные, пароль на почту не придет до тех пор, пока не введете свободный инвайт.
Свежие инвайты для регистрации на httpinternet.net (LookandEarn.biz): 0.80$ ЗА 1000 КАПЧИ
Инвайты:
15e7e0ec
bed032a9
fceb4fff
bf495d30
5964c3ef
16b8257c
5a6a2559
b76345c9
de48d7ed
8156072f
Один инвайт – один пользователь. Если инвайт использован, второй раз он не подходит, т.е. как не вводить регистрационные данные, пароль на почту не придет до тех пор, пока не введете свободный инвайт.
А по мне капча – трата времени, так убедится в том, что кто то платит в нете. Но подумайте, ведь можно зарабатывать на много больше.
Я робот. Я прошел…
И я тоже прошел… Приветствую роботов…
Роботы полезли…
Все еще содержите штатного бухгалтера?
Оплачиваете содержание рабочего места, программное обеспечение и т.п.?
Доверив бухгалтерский учет своей фирмы компании ДАТА ГРУПП, Вы сможете сэкономить от 400 тр в год!
Почему мы?
– Предлагаем профессиональный бухгалтерский и налоговый учет для малого и среднего бизнеса.
– Полный спектр услуг – от регистрации фирм и сдачи нулевой отчетности, до ведения кадрового учета и просчета заработной платы сотрудников.
– Прозрачные цены на все виды услуг доступны на сайте.
– АКЦИЯ! Бесплатная регистрация ООО или ИП при заключении договора на бухгалтерское обслуживание.
– Гарантия услуг. На все работы даем гарантию без срока давности!
Подробная информация и стоимость услуг на сайте:
http://www.data-group.ch
тел +7 (495) 748-85-96
Капча – лохотрон и бесполезная трата времени.