Дропшиппинг и парсинг
Сегодня дропшиппинг является одной из быстро набирающих популярность бизнес-моделей.
Для реализации данной идеи вам необходим интернет-магазин, и вы должны его заполнить товарами. Эффективно работает всё это в том случае, когда товаров в вашем магазине действительно много — есть из чего выбрать. По сути, лучше всего если вы станете неким агрегатором в определенной товарной области, знающим где дешевле взять определённый товар и, соответственно, предложить конкурентоспособную цену своему покупателю.
Конечно, можно наполнить магазин товарами вручную. Однако, даже из расчёта, что у вас будет уходить 3-5 минуты на товар, а учитывая, что ему нужно придать не только описание, но и картинки (лучше галерею картинок), надо прописать категории, теги, атрибуты, установить цену, скидку, доступность, вариабельным товаром нужно придать варианты со своими изображениями, атрибутами и ценами, желательно также выполнить ряд действий по SEO и много других вещей — часто 5 минут оказывается даже недостаточно. Таким образом для создания среднего объёма магазина в 10 000 товаров понадобится около 3-х месяцев напряженной работы одного сотрудника. В реальности же человек не может работать в таком режиме весь 8-часовой рабочий день, поэтому, скорее всего уйдет полгода.
И дело даже не в оплате труда сотрудника, дело в упущенном времени, в течение которого ваши конкуренты уже активно осваивают рынок.
Именно в этом вопросе мы и можем помочь вам. Кстати, поможем создать и сам сайт онлайн-магазина.
Проще всего будет изложить характер данной услуги, описав её этапы.
Этапы работ по первоначальному наполнению магазина товарами.
Подготовка (проектирование) структуры интернет-магазина
На этом этапе определяется, какие у вашего торгового ассортимента будут категории, теги, атрибуты; какие атрибуты будут элементами навигации (фильтрации) в магазине, а какие будут носить лишь описательный характер товара, будут ли у вас вариабельные товары, планируется ли мультиязычность. Следует также определиться будете ли вы в дальнейшем обновлять свою базу из тех же источников или каким-то иным способом.
Создание базы товаров
На этом этапе и осуществляется парсинг. Надо собрать базу товаров в каком-либо формате, например, в виде таблиц Excel. Если структура вашего магазин в точности соответствует структуре источника информации, то это идеальный случай. Если нет, но ваш источник один, то будет чуть сложнее — надо будет реализовать механизм приведения одной структуры к другой. Если же источников много и у всех разная структура, то это самый сложный случай – помимо того, что для каждого источника надо будет делать упомянутый механизм приведения, необходимо будет проверять, существует ли уже данный товар в вашей базе (с другого сайта, возможно под другим названием). Данная работа для каждого источника делится на две части: создание парсера, т.е. написания программного кода и его работу по сбору информации с информационного ресурса.
Для формирования базы в 10 000 товаров с случае одного источника время обычно составляет 3-6 рабочих дней в зависимости от сложности сайта, скорости его работы и доступности. Отдельный, исключительный по скорости сбора, случай — это если ваш партнер по дропшиппингу может предоставить вам готовую базу товаров, выгрузив её, например, в XML или CSV формате из своего интернет-магазина или бухгалтерской программы. Тогда останется только написать код, который приведёт эту базу к вашей структуре и загрузить полученный результат на сайт.
Загрузка подготовленной базы на сайт
Здесь осуществляется подготовка шаблона, который будет применяться во время первой загрузки (и последующих обновлений) информации о товарах на ваш сайт, обычно из таблиц Excel.
Чтобы программно “залить” товары в ваш интернет-магазин в количестве, например упомянутых 10 000, может потребоваться от нескольких часов до 2-3 дней, в зависимости от мощности хостинга, на котором размещён ваш сайт.
В дальнейшем вы также можете заказать у нас поддержку или просто переодически обращаться к нам по вопросам обновления баз данных: добавления новых товаров, актуализации цен или другой информации. Естественно, в этом случае стоимость наших услуг будут намного ниже, так как парсеры и механизмы приведения уже написаны, хотя возможно и понадобится некоторая корректура кода в связи с изменением, например, структуры сайта-источника или вашего сайта.
Отдельный вопрос
Наша фирма не является юридической компанией и поэтому дальнейший текст нельзя считать официальной юридической информацией. Мы будем рассуждать не юридически, а логически, как и положено программистам)
Вопрос этот часто возникает в данной сфере и заключается в том — является ли парсинг сайтов законным действием. Тут надо отметить, что потребление общедоступной информации в принципе всегда само по себе законно. Вы можете записывать телепередачи или радиопередачи, вам никто не мешает переписать книгу, вы также можете сохранять веб страницы целиком или частями.
В принципе нет ограничений на то, каким способом лично вы будете «потреблять и усваивать» общедоступную информацию: глазами, ушами, пальцами или техническими приспособлениями, будете ли вы её запоминать и, если да, то как вы это будете делать. Никто не запрещает вам анализировать или структурировать информацию с помощью собственного мозга или, опять же, с помощью технических средств.
Вопрос законности начинается с момента использования. И тут уже всё зависит от самой информации, какие права на неё или связанную с ней продукцию установлены (авторские, торговые, лицензионные…), можно ли её распространять как свою или от своего имени, можно ли её продавать без лицензии или разрешения правообладателя и т.д. Поскольку тут возникает масса вопросов в каждой конкретной ситуации, то и по каждому определённому случаю лучше проконсультироваться у профильного юриста. От своего имени мы настоятельно рекомендуем это сделать во избежание будущих неприятностей.
Мы же предлагаем собрать для вас из общедоступных источников заданный объём информации и структурировать её в удобном вам формате — сделать это быстро и качественно. Например, создать каталог автозапчастей, рыболовных принадлежностей или строительных материалов – любой продукции, информация о которой вам может понадобиться для начального заполнения вашего интернет-магазина.
Некоторые сайты ставят защиту от роботов, но, как правило, это делается не для защиты от просмотра страниц, что вообще было бы странно, а для защиты отправки различных запросов спамового или вредоносного характера через контактные или другие формы. В принципе хозяин сайта, конечно, может ставить защиту и именно на просмотр сайта роботами – это его право. Допустим он так хочет уменьшить нагрузку на сайт. Но если робот такую защиту обходит, то никакого нарушения закона не происходит. Так же, как и наоборот – человек, который не прошёл защиту, установленную для робота, тоже никак не может подать за это в суд. В конце концов тот же Гугл или любая друга поисковая система «ходят» по интернету, собирают с сайтов информацию, структурируют, индексируют, то есть делают как раз тот самый парсинг и никого не спрашивают. Можно, конечно, «попросить» с помощью специальной инструкции поисковые системы не индексировать сайт, но будут ли они ей следовать — зависит от них.
Да и в общем смысле, роботы (пока во всяком случае) не посещают сайты по своей инициативе, они действуют в соответствии с заданными человеком алгоритмами и в его интересах. То есть конечным потребителем контента является не робот, а человек – робот тут лишь посредник.
Желаем вам удачи в новом бизнесе и реализации всех ваших идей!