Есть проблемный сайт https://carpology.ru/. У него есть выгрузка. https://carpology.ru/bitrix/catalog_export/for_opt.php. В ней бывают расхождения с самим сайтом. Например, товар с артикулом 1519060. На сайте - https://carpology.ru/catalog/kryuchki_uni_cat_new_age_s_hook/?oid=6926&r1=yandext&r2= - у него статус "ожидаем получения", а в выгрузке <param name="В наличии">Y</param>. На самом сайте, как я смог понять, данные подгружаются через скрипт. в исходном коде они в одну строчку где-то в коде указаны. Реально ли вообще сверять наличие через сайт. а не выгрузку? Я не смог найти способа. Так же проблемы были с фотографиями, в итоге сама выгрузка настроена через смесь СимплПарс и АОП
Может, но вы видели как в коде написан статус товара? Там по сути 1 страница на все опции, меняется адрес без перезагрузки экрана и подставляются данные. В исходном коде в этом месте их нет. Потому и ищу кто сможет, если это вообще реально
они не подгружаются через скрип, при выборе опции подгружается карточка другого товара, посмотрите на урл, он меняется, так же меняется и артикул, когда вы парсите то парсится только основная карточка к которой привязаны остальные карточки этого товара, но они не видимы так сказать на сайте в каталоге, поэтому вы парсите только 1 карточку. для примера размер №1 урл https://carpology.ru/catalog/kryuchki_uni_cat_new_age_s_hook/?oid=6923 размер № 4 урл https://carpology.ru/catalog/kryuchki_uni_cat_new_age_s_hook/?oid=6925 размер № 6 урл https://carpology.ru/catalog/kryuchki_uni_cat_new_age_s_hook/?oid=6926 вряд ли получится спарсить с сайта нормально, только просить что бы давали обновления чаще.
Знаю, но в исходном коде их можно увидеть. И цену. и наличие. Для каждой опции. Может скрипт берёт из базы, а может через JS из кода скрипта (его можно найти поиском по странице). Заставить обновляться чаще нереально. Если вообще невозможно, остаётся только смириться