Bitcoin Forum
May 17, 2024, 12:38:39 AM *
News: Latest Bitcoin Core release: 27.0 [Torrent]
 
   Home   Help Search Login Register More  
Pages: « 1 [2] 3 »  All
  Print  
Author Topic: Парсинг форума  (Read 1024 times)
kzv
Legendary
*
Offline Offline

Activity: 1722
Merit: 1285

OpenTrade - Open Source Cryptocurrency Exchange


View Profile WWW
June 20, 2018, 03:51:23 AM
 #21

Клауд это маркетинговое говно для веб школоты.
Все что делает клауд это запускает при первом заходе простейший яваскрипт с таймером. Типо проверка, что заходит браузер, а не робот лол. Все остальные вызовы проходят через чутка допиленный нгинкс.

OpenTrade - Open Source Cryptocurrency Exchange
ronaldinio (OP)
Newbie
*
Offline Offline

Activity: 26
Merit: 0


View Profile
June 23, 2018, 11:07:03 PM
 #22

Всем спасибо за советы. В итоге написал парсер на VBA Excel, неделя на изучение, 3 недели на написание кода. Самый большой плюс VBA Excel это не нужно заморачиваться с базами данных, когда нужно что то быстро написать на "коленке" и структурировать информацию, тем более что Excel хорошо знаю, но не был знаком с VBA. Парсинг немного тормознутый, но недавно узнал что есть поддержка selenium. Для более серьезного парсинга, надо будет изучать что то посерьезней.
crypt0pank
Newbie
*
Offline Offline

Activity: 3
Merit: 0


View Profile
June 27, 2018, 09:30:05 PM
 #23

Всем спасибо за советы. В итоге написал парсер на VBA Excel, неделя на изучение, 3 недели на написание кода. Самый большой плюс VBA Excel это не нужно заморачиваться с базами данных, когда нужно что то быстро написать на "коленке" и структурировать информацию, тем более что Excel хорошо знаю, но не был знаком с VBA. Парсинг немного тормознутый, но недавно узнал что есть поддержка selenium. Для более серьезного парсинга, надо будет изучать что то посерьезней.
Изучай C#, сможешь парсить всё что угодно, там куча библиотек, часто нужны управляемые браузеры, чтобы кликнуть куда-то, чтобы popup открылся, или прокрутить вниз, чтобы страничка прогрузилась, там можно подключить несколько управляемых браузеров (тот же селениум есть на C#, мозилла, хромиум, он же хром, стандартный IE - на нём вообще свой рабочий браузер можно за 2 минуты наваять - я это на ютубе увидел, с тех пор дружу с C#, хотя я на GeckoFX лучше за 5 минут сделаю), конечно ещё лучше C или C++, это прям вообще круто, но мне вот лень их изучать, я C# знаю, там плюшек много слишком.
TheMadman1992
Newbie
*
Offline Offline

Activity: 70
Merit: 0


View Profile
June 28, 2018, 12:10:31 AM
 #24

Все кто тебе здесь ответил - первый раз слышат слово парсинг и тем более в этом не шарят
да и ты сам не шиша не шаришь раз так вопрос ставишь
Доброго времени суток! А как надо ставить вопрос? И чем плох nodejs с модулем puppetteer? Если Вы в этом разбираетесь может просветите?
kzv
Legendary
*
Offline Offline

Activity: 1722
Merit: 1285

OpenTrade - Open Source Cryptocurrency Exchange


View Profile WWW
June 28, 2018, 05:17:36 AM
 #25

Все кто тебе здесь ответил - первый раз слышат слово парсинг и тем более в этом не шарят
да и ты сам не шиша не шаришь раз так вопрос ставишь
Доброго времени суток! А как надо ставить вопрос? И чем плох nodejs с модулем puppetteer? Если Вы в этом разбираетесь может просветите?


Не обращайте внимания это бот-флудер. Его высер подойдет к любой теме с вопросом.
Кстати, можете заработать мерит от модератора если будете искать таких долбоебов и репортить на них.

OpenTrade - Open Source Cryptocurrency Exchange
Anrxa
Member
**
Offline Offline

Activity: 107
Merit: 10


View Profile
June 29, 2018, 04:58:50 PM
 #26

Как уже выше ответили парсить можно чем угодно, главное регулярки или удобные фреймворки.
Node.js мне например нравится тем, что он асинхронен. Парсить в несколько потоков как по мне удобнее указывая concurrency у промисов нежели руками создавать потоки в синхронных языках.

fxpc
Sr. Member
****
Offline Offline

Activity: 1316
Merit: 420


KTO EC/\U HUKTO?


View Profile
June 29, 2018, 05:41:35 PM
Merited by imhoneer (1)
 #27

Все кто тебе здесь ответил - первый раз слышат слово парсинг и тем более в этом не шарят
да и ты сам не шиша не шаришь раз так вопрос ставишь
Доброго времени суток! А как надо ставить вопрос? И чем плох nodejs с модулем puppetteer? Если Вы в этом разбираетесь может просветите?


Не обращайте внимания это бот-флудер. Его высер подойдет к любой теме с вопросом.
Кстати, можете заработать мерит от модератора если будете искать таких долбоебов и репортить на них.

Чё-то мне нихуа не накидывают мерита. Cool

mig38
Newbie
*
Offline Offline

Activity: 46
Merit: 0


View Profile
July 09, 2018, 07:25:28 AM
 #28

Тоже через пыху парсил. Работаю в конторе, которая парсит с ~6000 сайтов интернет-магазинов товары для последующей выгрузки в соц сети типа вк, ок и в файлы эксель, цсв

а зачем чужие товары с чужих магазинов выкладывать в свой ВК ?
Jaga-Jaga
Sr. Member
****
Offline Offline

Activity: 613
Merit: 256



View Profile
July 09, 2018, 01:57:35 PM
 #29

Всем спасибо за советы. В итоге написал парсер на VBA Excel, неделя на изучение, 3 недели на написание кода. Самый большой плюс VBA Excel это не нужно заморачиваться с базами данных, когда нужно что то быстро написать на "коленке" и структурировать информацию, тем более что Excel хорошо знаю, но не был знаком с VBA. Парсинг немного тормознутый, но недавно узнал что есть поддержка selenium. Для более серьезного парсинга, надо будет изучать что то посерьезней.
IMHO, в общем случае более целесообразно парсить и сохранять в базу данных, а не в Excel.

           ▀██▄ ▄██▀
            ▐█████▌
           ▄███▀███▄
         ▄████▄  ▀███▄
       ▄███▀ ▀██▄  ▀███▄
     ▄███▀  ▄█████▄  ▀███▄
   ▄███▀  ▄███▀ ▀███▄  ▀███▄
  ███▀  ▄████▌   ▐████▄  ▀███
 ███   ██▀  ██▄ ▄██  ▀██   ███
███   ███  ███   ███  ███   ███
███   ███   ███████   ███   ███
 ███   ███▄▄       ▄▄███   ███
  ███▄   ▀▀█████████▀▀   ▄███
   ▀████▄▄           ▄▄████▀
      ▀▀███████████████▀▀
DeepOnion
███
███
███
███
███
███
███
███
███
███
   Anonymity Guaranteed
   Anonymous and Untraceable
   Guard Your Privacy
      ▄▄██████████▄▄
    ▄███▀▀      ▀▀█▀   ▄▄
   ███▀              ▄███
  ███              ▄███▀   ▄▄
 ███▌  ▄▄▄▄      ▄███▀   ▄███
▐███  ██████   ▄███▀   ▄███▀
███▌ ███  ███▄███▀   ▄███▀
███▌ ███   ████▀   ▄███▀
███▌  ███   █▀   ▄███▀  ███
▐███   ███     ▄███▀   ███
 ███▌   ███  ▄███▀     ███
  ███    ██████▀      ███
   ███▄             ▄███
    ▀███▄▄       ▄▄███▀
      ▀▀███████████▀▀
#Cryptoman
Member
**
Offline Offline

Activity: 980
Merit: 48


View Profile
July 11, 2018, 10:51:49 AM
 #30

Тоже через пыху парсил. Работаю в конторе, которая парсит с ~6000 сайтов интернет-магазинов товары для последующей выгрузки в соц сети типа вк, ок и в файлы эксель, цсв
а зачем чужие товары с чужих магазинов выкладывать в свой ВК ?

В линках на товар, если есть рефки, разница между диллером и тобой идет тебе в карман.
И порой чистая прибыль может составлять миллионы рублей за месяц.

https://indx.ru криптобиржа от вебмоней, не воруют, не требуют доказательств происхождения средств.
thereader
Member
**
Offline Offline

Activity: 278
Merit: 15


View Profile
August 06, 2018, 12:20:33 PM
 #31

У меня для поверхностного изучения языка, чтобы уже начать писать что-то полезное, обычно уходит около месяца. Лучше подучу язык, сам напишу, тем более что возможно придется что-то постоянно дописывать, плюс получу полезный навык.

Чувак, если ты это сделаешь, то дай знать. Я тоже такой хочу - есть парочка идей.

Discuss the development of your business in our telegram chat.
#Cryptoman
Member
**
Offline Offline

Activity: 980
Merit: 48


View Profile
August 07, 2018, 04:57:04 AM
 #32

Чувак, если ты это сделаешь, то дай знать. Я тоже такой хочу - есть парочка идей.

Что он сделает? Пиши свои идеи.

https://indx.ru криптобиржа от вебмоней, не воруют, не требуют доказательств происхождения средств.
thereader
Member
**
Offline Offline

Activity: 278
Merit: 15


View Profile
August 07, 2018, 12:02:20 PM
 #33

Что он сделает? Пиши свои идеи.

Давно хочу приложение на мобайл с форумом. Адаптивное. Например. Или отслеживание постов, набирающих тренд. 

Discuss the development of your business in our telegram chat.
peter_walstein
Newbie
*
Offline Offline

Activity: 1
Merit: 0


View Profile
July 24, 2019, 10:29:00 PM
 #34

Если нужно по мелочи сделать - сделаю. Опыт в парсинге огромен.

Ищем народ на парсинг различных источников, оплата сдельная, либо возможно постоянная.
peter_walstein@protonmail.com
TechPriest
Sr. Member
****
Offline Offline

Activity: 377
Merit: 282


Finis coronat opus


View Profile
July 26, 2019, 11:15:03 AM
 #35

Может у кого есть опыт парсинга подобно этому форуму,  ибо сам форум далеко не совершенен для отслеживания нужной информации. Какой язык программирования можете порекомендовать для этих целей? Понятно дело что практически любой язык может это делать, но делать это быстро и удобно не всякий.

Я давно еще писал парсер новых тем, по баунти. Я писал на Шарпе, проблем не возникало. Серверную часть делал на Питоне.

Форум довольно простой, думаю любой язык подойдет.

In science we trust!
andy_pelevin
Legendary
*
Offline Offline

Activity: 2224
Merit: 1123


Altcoinlog


View Profile
July 26, 2019, 05:58:15 PM
 #36

....

Я давно еще писал парсер новых тем, по баунти. Я писал на Шарпе, проблем не возникало. Серверную часть делал на Питоне.

Форум довольно простой, думаю любой язык подойдет.

Делать парсер новых тем на БТТ нет необходимости. Достаточно оформить подписку и сообщения о новых темах будут автоматом отправляться на вашу почту.
В правом вернем углу есть строчка команд " new topic  |  post new poll  |  mark read  |  notify " Достаточно нажать на " notify " и Вы в курсе всех новых тем.


█████████████████████████████████████████████
█████████████████████`````███████████████████
████████████████████```````██████████████████
███████████████████````````█████████████████
██████████████████```███`````████████████████
█████████████████```█████`````███████████████
████████████████```███████`````██████████████
███████████████```█████████`````█████████████
██████████████```````````````````████████████
█████████████```█████████████`````███████████
████████████```███████████████`````██████████
███████████```█████████████████`````█████████
██████████```███████████████████`````████████
████████`````███████████████████```````██████
█████████████████████████████████████████████
gdgdgdg
Altcoin
КАК НАСТРОИТЬ МАЙНИНГ?
ИНСТРУКЦИЯ

| OK   VKONTAKTE
| TWITTER   TELEGRAM
| FACEBOOK    INSTAGRAM


[/center
TechPriest
Sr. Member
****
Offline Offline

Activity: 377
Merit: 282


Finis coronat opus


View Profile
July 31, 2019, 06:04:02 AM
 #37

Делать парсер новых тем на БТТ нет необходимости. Достаточно оформить подписку и сообщения о новых темах будут автоматом отправляться на вашу почту.
В правом вернем углу есть строчка команд " new topic  |  post new poll  |  mark read  |  notify " Достаточно нажать на " notify " и Вы в курсе всех новых тем.

Благодарю за помощь, но проблема в том, что через мейл нужно и страницу с мылом держать открытой, обновлять ее постоянно, да и телефона хорошего для оповещения тогда не имел. А бот раз два, и прислал уведомление на компьютер. И быстродействие у него повыше, я ведь пробовал и ваш вариант.

In science we trust!
andy_pelevin
Legendary
*
Offline Offline

Activity: 2224
Merit: 1123


Altcoinlog


View Profile
August 05, 2019, 07:10:40 AM
 #38

..... проблема в том, что через мейл нужно и страницу с мылом держать открытой, обновлять ее постоянно,....

И эта задачка тоже легко решается,... Существует много расширений для браузеров, которые мониторят почту.  Я, к примеру, пользуюсь "Checker Plus for Gmail", но есть и другие...


█████████████████████████████████████████████
█████████████████████`````███████████████████
████████████████████```````██████████████████
███████████████████````````█████████████████
██████████████████```███`````████████████████
█████████████████```█████`````███████████████
████████████████```███████`````██████████████
███████████████```█████████`````█████████████
██████████████```````````````````████████████
█████████████```█████████████`````███████████
████████████```███████████████`````██████████
███████████```█████████████████`````█████████
██████████```███████████████████`````████████
████████`````███████████████████```````██████
█████████████████████████████████████████████
gdgdgdg
Altcoin
КАК НАСТРОИТЬ МАЙНИНГ?
ИНСТРУКЦИЯ

| OK   VKONTAKTE
| TWITTER   TELEGRAM
| FACEBOOK    INSTAGRAM


[/center
TechPriest
Sr. Member
****
Offline Offline

Activity: 377
Merit: 282


Finis coronat opus


View Profile
September 16, 2019, 06:54:23 PM
 #39

..... проблема в том, что через мейл нужно и страницу с мылом держать открытой, обновлять ее постоянно,....

И эта задачка тоже легко решается,... Существует много расширений для браузеров, которые мониторят почту.  Я, к примеру, пользуюсь "Checker Plus for Gmail", но есть и другие...


Расширениям не очень доверяю, кто его знает что туда записали девы. Проще написать свой небольшой скрипт, загрузить на свой сервер и быть спокойным.

In science we trust!
RuBro
Jr. Member
*
Offline Offline

Activity: 71
Merit: 3


View Profile
September 17, 2019, 03:22:33 AM
 #40

С парсерами и постерами вы ошиблись форумом, юзайте более профильный форум с готовыми решениями https://zennolab.com
Pages: « 1 [2] 3 »  All
  Print  
 
Jump to:  

Powered by MySQL Powered by PHP Powered by SMF 1.1.19 | SMF © 2006-2009, Simple Machines Valid XHTML 1.0! Valid CSS!