Прочитав замечательную серию постов про сателлиты, мне сразу захотелось сотворить что-нибудь эдакое, что-нить похожее, и проверить на практике теорию заработка на сателлитах.

Я сразу решил, что сателит мой будет белым, т.е. почти СДЛ :) т.к. мне больше нравится сначала хорошо поработать, а потом ниче не делать — тока бабки снимать, чем хреново работать, но постоянно. Тематика в принципе была не важна, все упиралось в уникальный контент — какой найду, такова и будет тема сайта. Самым простым для меня выходом в проблеме контента было сканирование+распознание книги, что, собственно, я и сделал.

Зашел в книжный магазин, отправился к стеллажам с технической литературой. Мне нужна была техническая книга, лучше всего справочного типа, но с небольшим количеством таблиц и формул, т.к. подобные элементы сильно затрудняют распознавание и не приносят пользы с точки зрения привлекательности для поисковиков.

Через некоторое время мне попалась именно та книга, которая мне была нужна. К сожалению, конкретных названий, авторов и адресов я публиковать не буду, все-таки хочется сохранить сателлит как можно дольше. Это была справочная литература по «заводской» тематики, там было довольно много рисунков (что, вообщем-то, для белого сателлита хорошо), совсем немного таблиц и куча букв латинского алфавита, обозначающие различные силы, плотности, напряжения и прочее (это, конечно, плохо, но лучшего варианта я тогда не нашел).

Купил (160 руб), пришел домой, проверил уникальность. Пять длинных фраз с разных частей книги яндекс не нашел. Отлично, контент уникальный. Следующим этапом было сканирование и распознавание этой книги. Я раньше занимался подобными делами, и по себе знаю, что это довольно утомительное и трудное занятие… Вообщем, я поручил это дело одной девушке, которая замечательно сделала все что было нужно за 1.5к рублей. В итоге, за 1650 рублей у меня было 160 страниц уникального тематического белого текста (хе, получилось по 10 рублей на страницу).

Изначально, когда я загорелся идеей, мне хотелось написать свой движок под это дело. Но попозже понял, что писать под каждый сателлит свой движок — слишком жирно, и в итоге выбрал всеми любимый вордпресс, да и с дизайном сразу решалась проблема (куча шаблонов).

Теперь осталось зарегистрировать домен и решить проблему с формулами. Домен — зарегистрировал ru-домен, т.к. сейчас есть возможность регистрировать его очень дешево. Про формулы — сложнее. Распознанный текст находится в doc-формате, и надо как-то, желательно автоматом, конвертнуть формулы в html-формат… Главным образом надо решить проблему индексов и степеней (текст ниже и выше стандартного). В HTML`е есть замечательные тэги: <sub> и <sup> , видимо, их и надо заюзать.

Итак, пока расходов:
160 руб — стоимость книги
1500 руб — скан и распознавание
100 руб — домен. Хостинг еще не выбрал.

Следующая группа шагов — разбивка книги на статьи-посты с html-оформлением, подготовка картинок под веб, хостинг, поиск и установка шаблона и плагинов, их настройка.