나스당 이치로 님의(잘 기억이 안나서 검색해 보니 소주6잔님 글이었네요.)
글을 읽고 호기심이 생겨서, selenium으로
한 달 반정도 구글링하면서 코드 작성중입니다.
(일단 작성하고 있는데 코드 개판이네요. 안 이뻐요 ;ㅁ;)
저는 3.5.2와 3.7 기준으로 하려하니 phantomjs(? 맞나??)으로는 안되더라고요.
chromedriver로 테스트는 윈도우에서 계속 작성중인데, 오늘 등록된 날짜와 실행하는 날짜를
기준으로 1일이내 링크 불러오는 것 완료하였습니다.
몇 일 끙끙 싸매다가 어느정도 완성되니 카타르시스가 쫘악~~~~
python이 라이브러리도 많고, 시덥잖은 질문도 구글링하니 많이 나와서
예전에 autoit으로 Crawling 할 때보다 시간도 적게 든 거 같고, 재밌네요.
요령을 잘 파악해서 RSS 없이 직접 다운로드하는 것도 가능할 듯하여 열심히 해보려 합니다.
여러분~ 파이썬 하세요~ 두~~우~~ 번 하세요~~
값을 받아오는거라서... 대신 무거운 만큼의 값은 합니다. 동적웹에 대응하고 세션같은거 신경써줄필요 없고
소스 길이는 짧아지죠.
반대로 동적웹이 아니라면 굳이 쓸 필요가 없기도 합니다. bs4로 파싱하고 세션 필요하면 리퀘스트로
처리해주며 소스 길이는 훨씬 길어진다 해도 이쪽이 훨씬 빠르고 가볍게 돌거든요.