CAT | Программирование
Вотс интересный генератор текстов. На английском конечно генерит несравненно лучшие тексты *** Кроме того, алгоритм представлял собой длинную инструкцию с многочисленным перечнем операций. Но после этого, методы грамматики лингуистка тщательно конструировать грамматику которую они используют. Оно некоторо поистине что даже чисто людск- переводы прональны к ошибке. Остается перевести числа в соответствующие русские буквы стали числами: [...]
24
Генератор текста на основе триграмм (python)
0 Comments | Posted by twist in Программирование
Каждый уважающий себя дорвейщик должен написать для себя генератор текстов для наполнения своих дорвеев. Иногда же его проще приобрести готовым. В ниже приведенном посте я вкратце рассказал о своих наработках в этой теме. Алгоритм есть цепь Маркова либо сеть Байеса. Можно назвать просто триграммной моделью. Суть от этого не меняется. Линк: Генератор текстов Желаю удачи [...]
11
HTTP клиент на Python или как написать бота.
7 Comments | Posted by twist in Программирование, Социальные сети
Внимание! доступна новая версия HTTP-клиента. -> Обновленный Python HTTP клиент Каждый вебмастер использует в своей работе софт, который так или иначе взаимодействует с web. Начиная от браузера и заканчивая всевозможными парсерами, спамилками, доргенами. Но зачастую, перед нами встают особые задачи, которые невозможно решить при помощи имеющегося набора инструментов. В таких случаях приходится трудиться руками или [...]
9
URL автоматической настройки сервиса прокси в firefox
7 Comments | Posted by twist in Информация, Программирование
Недавно наткнулся на интересную штуку в Firefox. В настройках прокси нашего браузера есть пункт URL автоматической настройки сервиса прокси. Эта штука позволяет задать свою собственную функцию выбора прокси сервера для браузера. Впринципе все достаточно ясно описано тут: http://en.wikipedia.org/wiki/Proxy_auto-config, но от себя, все же, добавлю нестандартный пример. Передо мной стояла задача смены прокси адреса при каждом [...]
6
7search и промокашки — работаем без бана
2 Comments | Posted by twist in Traffic, Программирование
Статья посвящена неизвестному дорвейщику-Xrumerоводу, в дорах которого я подглядел треть написанного ниже. Идея отнюдь не нова, но я описываю свои мысли и технический мануал, по которому любой человек сможет улучшить свои отношения с 7search и другими рекламодателями, придирчивыми к источникам трафика. Больше всего эта статья поможет новичкам. Гуру читать необязательно Любой вебмастер отдал бы многое [...]
Недавно передо мной встала задача, которую было необходимо срочно решать. Проблема была в том, что мне необходимо вызывать php-скрипт с разными параметрами 100-200 раз одновременно и вешать эти задачи на cron. Что делать? Ведь забивать в crontab тысячи однотипных строк — это совсем не наш метод. Мне понадобилась масштабируемость, которая позволит объединять задачи по однотипным [...]
29
Пишем граббер контента. Часть 2 – Исходный код.
6 Comments | Posted by twist in Программирование
В предыдущей статье был проведен анализ источника контента под который мы должны написать парсер либо граббер — назвать можно как угодно. Суть скрипта от этого не изменится — собрать с чужого сайта контент по определенным нами законам. Настоятельно рекомендую ознакомиться с первой частью этой темы, прежде чем читать дальше. Итак, наша исходная задача: напарсить все [...]
25
Пишем граббер контента. Часть 1 — Анализ донора.
5 Comments | Posted by twist in Программирование
У вебмастеров часто возникает необходимость собрать контент с чужих сайтов. Цели все преследуют разные. Кому-то понадобится собрать чужую галерею картинок, другому технические данные товаров из электронного магазина конкурента, третьему нужны статьи для дальнейшего рерайта, а кто-то, возможно, собирает email-адреса из популярной социалки. Конечно, в поиске и сборе информации нет особой сложности, но если нам нужно [...]
24
Передача HTTP REFERER через JavaScript
13 Comments | Posted by twist in Traffic, Программирование
Довольно часто возникает необходимость перенаправить пользователя со своего сайта по определенной ссылке «насильственно». Такая необходимость может быть вызвана, например тем, что Вы сливаете свой трафик с дорвея и не можете лить его сразу на партнерку, т.к. они Вас просто забанят. Поэтому необходимо создать прокладку, чтоб партнеры не узнали о реальных источниках трафа. Обычно траф отбеливается [...]




