CLIEN

본문 바로가기 메뉴 바로가기 폰트크기변경 색상반전보기
톺아보기 공감글 추천글
커뮤니티 C 모두의광장 F 모두의공원 I 사진게시판 Q 아무거나질문 D 정보와자료 N 새로운소식 T 유용한사이트 P 자료실 E 강좌/사용기 L 팁과강좌 U 사용기 · 체험단사용기 W 사고팔고 J 알뜰구매 S 회원중고장터 B 직접홍보 · 보험상담실 H 클리앙홈
소모임 소모임전체 임시소모임 ·테니스친당 ·굴러간당 ·주식한당 ·가상화폐당 ·아이포니앙 ·자전거당 ·MaClien ·방탄소년당 ·골프당 ·일본산당 ·나스당 ·키보드당 ·디아블로당 ·야구당 ·안드로메당 ·바다건너당 ·개발한당 ·노젓는당 ·테니스친당 ·레고당 ·육아당 ·소셜게임한당 ·리눅서당 ·콘솔한당 ·날아간당 ·소시당 ·이륜차당 ·냐옹이당 ·VR당 ·걸그룹당 ·땀흘린당 ·캠핑간당 ·PC튜닝한당 ·클다방 ·덕질한당 ·축구당 ·패스오브엑자일당 ·그림그린당 ·갖고다닌당 ·포뮬러당 ·와인마신당 ·퐁당퐁당 ·방송한당 ·스팀한당 ·심는당 ·시계찬당 ·IoT당 ·젬워한당 ·라즈베리파이당 ·활자중독당 ·소리당 ·3D메이킹 ·사과시계당 ·빨콩이당 ·보드게임당 ·DANGER당 ·LOLien ·오른당 ·대구당 ·임시소모임 ·개판이당 ·안경쓴당 ·요리한당 ·스타한당 ·찰칵찍당 ·SimSim하당 ·여행을떠난당 ·테스트당 ·헌팅한당 ·날아올랑 ·미드당 ·블록체인당 ·총쏜당 ·WOW당 ·영화본당 ·e북본당 ·물고기당 ·블랙베리당 ·윈태블릿당 ·창업한당 ·X세대당 ·배드민턴당 ·농구당 ·곰돌이당 ·뽀록이당(당구) ·볼링친당 ·문명하셨당 ·클래시앙 ·쿠키런당 ·동숲한당 ·이브한당 ·패셔니앙 ·도시어부당 ·FM한당 ·맛있겠당 ·차턴당 ·내집마련당 ·하스스톤한당 ·히어로즈한당 ·인스타한당 ·KARA당 ·어학당 ·가죽당 ·Mabinogien ·땅판당 ·MTG한당 ·노키앙 ·적는당 ·소풍간당 ·품앱이당 ·리듬탄당 ·Sea마당 ·심야식당 ·미끄러진당 ·나혼자산당 ·파도탄당 ·공대시계당 ·터치패드당 ·트윗당 ·WebOs당 ·윈폰이당
© CLIEN.NET
공지외부공격 및 접속장애 안내 더보기
l

팁과강좌

기타 파이썬 코딩 강의를 또 제작하였습니다 (활용편/웹스크래핑) 134

160
프라다2
24,716
2020-08-09 13:50:38 1.♡.77.212

안녕하세요.

지난번에 이어 새로운 파이썬 활용편 영상을 만들게 되어 글을 쓰게 되었습니다. ^^

이번 주제는 웹 스크래핑(크롤링 아님 주의)을 다뤄봤는데요.






혹시 늑대와 일곱 마리 아기 염소 이야기, 기억 하시나요?


엄마가 집을 비운 사이 일곱 마리 아기 염소만 남아 있는데 나쁜 늑대가 찾아옵니다.

"나 엄마야, 문 좀 열어줘"

근데 한 아기 염소가 "우리 엄마 목소리는 그렇게 무섭지 않아!" 하면서 문을 열어주지 않지요.


다시 찾아온 늑대가 이번에는 예쁜 목소리로

"엄마란다, 문 좀 열어주겠니?"

하자 한 아기 염소가 물어봅니다.


"손을 내밀어 보세요"

그러고는 이내 진한 털에 발톱이 날카로운 발을 보고는

"우리 엄마 손은 아주 하얗단 말이에요" 라며 문을 열어주지 않아요.


뽀얀 밀가루를 잔뜩 묻히고 다시 나타난 늑대의 발을 보고,

이번에는 염소들이 속아서 문을 열어줬다가 낭패를 당합니다. (결말 스포는 안하겠습니다 ㅋㅋ)



자 여기서 늑대는 염소의 집을 뚫기 위해서 3번의 시도를 합니다.


1. 엄마라는 거짓말

2. 엄마라는 거짓말 + 예쁜 목소리 

3. 엄마라는 거짓말 + 예쁜 목소리 + 뽀얀 밀가루를 묻힌 발


결국 3번째에서 집을 뚫고 말지요.




서론이 길었는데요, 웹스크래핑은 바로 이러한 과정이 필요합니다. 마치 창과 방패의 싸움처럼, 쉬운 방패라면 그냥 아무 창이나 써도 되겠지만 튼튼한 방패를 뚫기 위해서는 더 날카롭고 정교하며 센 창으로 도전할 필요가 있지요.


그런데 웹 스크래핑에서는 사실  염소와 늑대의 입장이 조금 바뀝니다.

우리가 온순한 아기 늑대가 되고, 대상 서버가 우락부락한 근육질의 덩치 크고 뿔도 달린 엄마 염소가 됩니다. 저 서버를 어떻게든 공략을 해야 해요.






그러기 위해서 여러 접근 방법이 활용되는데 제 강의에서 위에 있는 늑대의 전략을 순서대로 하나씩 모두 설명을 드립니다.


아참, 웹 스크래핑과 웹 크롤링은 조금 다릅니다.



웹 크롤링은,

아재(저 포함)들은 아실 텐데 옛날에 '책 책 책 책을 읽읍시다' 라는 프로그램이 있었어요. 여기에서 하이라이트는, 책이 가득한 책장이 있고 옆에 카트가 하나를 두고 게스트에게 1분인가 시간을 줍니다. 그리고 그 시간동안 담을 수 있는 최대한 많은 책을 가져오면 그 책은 모두 게스트 소유가 되는 거에요. ("황금책"에 대한 설명은 논외로 하겠습니다 ^^)






이 때 여러분이 게스트라면 어떻게 하시겠어요? 아마 이것저것 따지지 않고 모조리 책을 최대한 빨리 담으려고 할겁니다. 이게 웹 크롤링이라고 보시면 되구요.



반면에 웹 스크래핑은, 시험 전날에 선생님이 하얀 종이를 한 장 주면서 여러분이 어떤 내용이든 필기를 해 오라고 합니다. 그러면 시험 시간에 그 종이 딱 1장은 펼쳐놓고 시험을 칠 수 있는 거에요. 그럼 여러분은 아마도 수업시간에 배운 중요한 내용이나 외우기 어려운 공식, 영어 단어 같은 것들을 참고하기 쉬운 형태로 빼곡히 적겠지요. 이게 바로 웹 스크래핑입니다.


서로 다르죠?






다시 말하면 웹 스크래핑은 웹사이트에서 내가 원하는 데이터를 추출해와서 내가 원하는 형태로 가공하는 행위를 말합니다. 


예를 들어 네이버 웹툰 페이지에 있는 모든 만화의 제목이나 실시간 순위 1-10 을 가져온다던지,




쿠팡 같은 쇼핑몰에서 딱 내가 원하는 조건에 맞는 상품만 링크와 함께 가져온다던지 

예제에서는

- 상위 1~5 페이지 내에서

- 리뷰가 100건이 넘고

- 평점이 4.5점이 넘으면서

- Apple 제품은 제외하고

- 광고 상품은 제외한

목록만 가져오도록 실습한답니다.

(절대 Apple 이 싫다거나 한 건 아니고 그냥 연습용일 뿐입니다 ㅎㅎ )




이미지를 다운로드 받는 연습도 해보구요. 제가 영화를 굉장히 좋아하는데 어떤 영화를 보면 좋을지 결정장애가 있어서 그냥 최근 5년간 관객 수가 가장 많은 상위 5개 영화에 대해서, 총 25 개 영화 포스터 이미지를 다운받아놓고 그중에 아무거나 선택을 하려 합니다. 이 이미지를 하나 하나 저장하려면 굉장히 많은 시간과 클릭질이 필요하지만 스크래핑 기술을 이용하면 몇 줄 안되는 코드로 파일명도 내가 원하는대로 저장할 수 있게 되지요.




그리고 어떤 데이터들은 가지고 오고 나서 엑셀로 관리하거나 추가 작업을 해야할 때도 있습니다. 그럴때는 간단하게 csv 형태로 파일을 만들면 바로 엑셀에서 열어볼 수도 있어요. 네이버 금융에서 코스피 시가총액 순위 정보를 모두 가져와보는 실습을 합니다.




그런데 이런 사이트들에서는 사람이 아닌 자동화 봇(Bot) 이 정보를 빼가는 것을 썩 달가워하지는 않을수도 있습니다. 무단으로 정보를 사용할 수도 있거니와 계속 페이지를 요청하게 되면 그만큼 서버에 큰 부담을 줄 수도 있거든요. 그래서 서버에서는 페이지를 볼 수 있는 권한을 주지 않거나 접근을 차단하는 등 다양한 방법으로 방어를 합니다.


그러나 늘 그렇듯 우리는 길을 찾을 겁니다.




때로는 로그인이 필요하거나 웹페이지에서 어떤 동작을 해야만 내가 원하는 데이터를 가져올 수도 있습니다. 동적으로 움직이는 웹페이지는 Selenium 이라는 웹 테스트 자동화 프레임워크를 이용해서 우리가 직접 브라우저를 자동으로 컨트롤 할 수도 있습니다. 이전의 방법들이 잘 안될때, 그냥 Selenium 으로 하면 웬만하면 해결이 될겁니다.


가령 구글 무비 페이지에서 인기차트 영화 중 현재 할인중인 영화 정보만 가져오고 싶은데 여기는 사용자가 스크롤을 내려야만 다음 목록이 불러와집니다. 





또는 네이버 항공권은 내가 원하는 일정을 입력하고 항공권 조회 버튼을 클릭하면 한참동안 로딩을 하고 나서 목록이 나타나기도 하지요.





Selenium 을 쓸 때도 이런 부분에 대해서는 오류를 줄이기 위해 보다 섬세한 접근이 필요하답니다. 물론 강의에서 모두 알려드립니다.




대충 지금까지 내용을 정리해보면 이렇습니다.









웹 스크래핑을 배우기 위해서는 사전지식이 필요한데요, 기본적으로 웹에 대해서 이해를 해야하기 때문에 간단히 HTML, XPath 에 대해서 공부하고, 크롬을 활용하기 때문에 크롬 및 개발자도구 이용 방법에 대해서도 설명드립니다. 그리고 스크래핑 과정에 정규식이 필요할 수도 있어서 아주 가볍게 언급합니다. 이 때문에 앞부분에 이론 설명이 조금 길어서 지루할 수 있지만 조금만 지나면 다양한 페이지에 대해 많은 실습이 이루어지므로 조금만 잘 참고 따라와주시면 좋겠습니다.





많은 내용을 공부하다보니 정리가 안되실 수도 있을까봐 WrapUp 시간을 가지구요, 아무래도 웹스크래핑은 지금까지의 활용편 주제와는 달리 다른 누군가가 만든 사이트를 대상으로 사용하는 기술이기 때문에 반드시 주의해야 하는 점에 대해서도 다시 한번 알려드립니다. 바쁘시거나 핵심만 알고싶다 하시는 분은 이 부분만 봐도 강의 전반적인 내용은 파악 가능합니다.




물론 이번에도 퀴즈를 드리지요.

다음 부동산 매물에서 검색한 결과 정보를 직접 여러분이 스크래핑 해오는 시간을 가져보구요,




마지막으로는 프로젝트를 진행합니다.

프로젝트 주제는 "나만의 가상 비서" 인데요.

제가 매일 아침에 일어나서 날씨를 확인하고, 주요 뉴스 및 IT 분야 뉴스를 읽는 것을 쉽게 해주는 프로그램을 만들겁니다. 하는 김에 1일 1영어 학습을 위해 매일 새로운 영어 회화 지문을 가져오는 것도 함께 해봅니다. 클릭 한 번이면 이 모든 정보들이 제가 원하는 형태로 가져와지는 것이죠.




굉장히 편하겠죠? 링크를 클릭하면 바로 뉴스 기사를 읽을수도 있게 됩니다.

그리고 이번 주제에서 다루지는 않지만 위에서 가져온 데이터를 이메일이나 카톡 등으로 보내면 매일 아침 아주 손쉽게 정보를 얻을 수 있을 겁니다. (이메일 자동화는 다음 활용편, 업무자동화에서 다뤄보겠습니다)



강의 영상은 여기에서 확인하시면 되구요,




위 내용을 아래 커리큘럼으로 구상하였습니다.

아마 파이썬 기초 문법만 아신다면 아래 내용만 가지고도 충분히 공부를 하실 수 있을거라 생각합니다.



[기본기]

(0:00:00) 0.Intro

(0:00:16) 1.소개

(0:02:03) 2.활용편3 소개

(0:07:26) 3.HTML

(0:16:51) 4.XPath

(0:28:12) 5.크롬

(0:31:45) 6.Requests

(0:39:26) 7.정규식 기본 1

(0:50:52) 8.정규식 기본 2

(0:58:56) 9.User Agent

(1:06:40) 10.BeautifulSoup4 기본 1 (네이버 웹툰)

(1:18:37) 11.BeautifulSoup4 기본 2 

(1:28:13) 12.BeautifulSoup4 활용 1-1 (가우스 전자)

(1:39:26) 13.BeautifulSoup4 활용 1-2

(1:47:55) 14.BeautifulSoup4 활용 2-1 (쿠팡)

(2:00:11) 15.BeautifulSoup4 활용 2-2

(2:05:35) 16.BeautifulSoup4 활용 2-3

(2:15:22) 17.BeautifulSoup4 활용 2-4

(2:22:44) 18.BeautifulSoup4 활용 3-1 (다음 이미지)

(2:31:46) 19.BeautifulSoup4 활용 3-2

(2:41:09) 20.CSV 기본 1 (네이버 금융)

(2:49:55) 21.CSV 기본 2

(2:56:21) 22.Selenium 기본 1

(3:07:45) 23.Selenium 기본 2

(3:13:43) 24.Selenium 심화 (네이버 로그인)

(3:21:40) 25.Selenium 활용 1-1 (네이버 항공권)

(3:33:40) 26.Selenium 활용 1-2 

(3:39:15) 27.Selenium 활용 2-1 (구글 무비)

(3:50:17) 28.Selenium 활용 2-2 

(4:00:39) 29.Selenium 활용 2-3 

(4:10:39) 30.Selenium 활용 2-4 

(4:15:24) 31.Headless 크롬

(4:23:38) 32.Wrap Up


[퀴즈]

(4:32:21) 33.퀴즈 (다음 부동산)


[프로젝트]

(4:43:13) 34.프로젝트

(4:48:49) 35.오늘의 날씨 (네이버 날씨)

(5:02:06) 36.헤드라인 뉴스 (네이버 뉴스)

(5:10:26) 37.IT 일반 뉴스 (네이버 뉴스)

(5:18:22) 38.오늘의 영어회화 (해커스 영어)

(5:27:25) 39.Outro




이 강의는 파이썬 기초 문법을 공부하신 분들을 위한 강의입니다.

그렇기 때문에 파이썬을 할 줄 모르시는 분은 아래 강의를 통해 먼저 공부해주시면 됩니다.


(기본편)




늘 부족하지만 이번에도 여러분들께 강의를 소개드릴 수 있어서 기쁘게 생각합니다. 다양한 사이트에 대해 다양한 실습을 해보려다 보니 내용이 다소 깁니다. 무려 5시간 30분이나 되는데요... 제가 강의 중에 잡소리는 진짜 하나도 하지 않아서 불필요한 시간 낭비는 없을 거라고 자신합니다. ^^;; (라고 믿고 싶습니다. 여러분의 시간은 소중하니까요..)


파이썬을 공부하신 분들께, 한 단계 실력을 올리기 위해 작게나마 도움되면 좋겠습니다.


긴 글 읽어주셔서 감사합니다!



프라다2님의 게시글 댓글
  • 주소복사
  • Facebook
  • Twitter
160명
댓글 • [134] 을 클릭하면 간단한 회원메모를 할 수 있습니다.
pixell
LINK
#116313423
IP 210.♡.193.116
08-09 2020-08-09 13:57:38
·
항상 잘 보고 있습니다.
프라다2
LINK
#116324387
IP 223.♡.210.209
08-09 2020-08-09 21:12:06
·
@pixell님 감사합니다 ^^
오리너굴
LINK
#116313496
IP 61.♡.97.115
08-09 2020-08-09 14:00:09
·
좋은 글 항상 감사드립니다.
잘 보고 있습니다.~
프라다2
LINK
#116324395
IP 223.♡.210.209
08-09 2020-08-09 21:12:25
·
@오리너굴님 도움되시길 바랍니다 ㅎㅎㅎ 감사합니다
Hiro76
LINK
#116313566
IP 211.♡.220.4
08-09 2020-08-09 14:02:12
·
열심히 시도해 보겠습니다. 감사합니다.
프라다2
LINK
#116324406
IP 223.♡.210.209
08-09 2020-08-09 21:12:43
·
@Hiro76님 ^^ 러닝 타임이 조금 길어서 걱정이네요
감정결핍
LINK
#116313749
IP 222.♡.187.17
08-09 2020-08-09 14:08:32
·
정말 감사합니다^^
프라다2
LINK
#116324412
IP 223.♡.210.209
08-09 2020-08-09 21:12:53
·
@감정결핍님 감사합니다 ^^ 열공하셔요
SPACEBALLS
LINK
#116313753
IP 119.♡.166.131
08-09 2020-08-09 14:08:42
·
굉장히 관심있던 분야네요. 감사합니다
프라다2
LINK
#116324421
IP 223.♡.210.209
08-09 2020-08-09 21:13:15
·
@TQQQ님 궁금해하시던 부분을 속시원히 알려드릴 수 있기를 희망합니다
ORACLEsays
LINK
#116314213
IP 27.♡.58.121
08-09 2020-08-09 14:23:52
·
감사합니다 :)
프라다2
LINK
#116324425
IP 223.♡.210.209
08-09 2020-08-09 21:13:25
·
@님 ^^ 즐공하셔요!
prop
LINK
#116314272
IP 112.♡.209.164
08-09 2020-08-09 14:26:25
·
궁금했는데 시간내서 보도록 할게요~
프라다2
LINK
#116324433
IP 223.♡.210.209
08-09 2020-08-09 21:13:37
·
@님 시간 되실때 찬찬히 보세요 ^^
청휘
LINK
#116314725
IP 221.♡.240.136
08-09 2020-08-09 14:44:41
·
좋은 글 잘봤습니다.
프라다2
LINK
#116324437
IP 223.♡.210.209
08-09 2020-08-09 21:13:48
·
@청휘님 감사합니다
래인맨
LINK
#116315162
IP 14.♡.201.94
08-09 2020-08-09 15:01:15
·
감사합니다. ^^
프라다2
LINK
#116324444
IP 223.♡.210.209
08-09 2020-08-09 21:13:58
·
@래인맨님 ^^ 댓글 감사드립니다
곰돌이푸우우
LINK
#116316004
IP 58.♡.211.19
08-09 2020-08-09 15:33:47
·
감사합니다
덕분에 드디어 스크래핑을 제대로 배울수 있을것같습니다
프라다2
LINK
#116324451
IP 223.♡.210.209
08-09 2020-08-09 21:14:15
·
@곰돌이푸우우님 열심히 준비했는데 도움되면 좋겠어요!
LightWorld
LINK
#116316315
IP 103.♡.13.11
08-09 2020-08-09 15:44:34
·
Selenium 짱입니다요~
프라다2
LINK
#116324460
IP 223.♡.210.209
08-09 2020-08-09 21:14:40
·
@LightWorld님 셀레느님 무적이지요 ㅋㅋㅋ
클리앙따라잡기
LINK
#116317009
IP 114.♡.170.119
08-09 2020-08-09 16:11:01
·
좋은 강의 감사합니다
프라다2
LINK
#116324493
IP 223.♡.210.209
08-09 2020-08-09 21:16:25
·
@클리앙따라잡기님 ^^ 도움되시면 좋겠어요
OriEns
LINK
#116317934
IP 223.♡.48.204
08-09 2020-08-09 16:53:14
·
감사합니다
프라다2
LINK
#116324499
IP 223.♡.210.209
08-09 2020-08-09 21:16:35
·
@OriEns님 감사합니다! ^^
빠이
LINK
#116318899
IP 211.♡.222.205
08-09 2020-08-09 17:31:12
·
멋진 내용이네요.
감사합니다.
프라다2
LINK
#116324510
IP 223.♡.210.209
08-09 2020-08-09 21:17:04
·
@빠이님 ^^ 감사합니다
연을쫓는아이
LINK
#116319390
IP 1.♡.198.43
08-09 2020-08-09 17:54:01
·
감사합니다. 이번 강의도 열심히 듣고 공부하겠습니다~^^
프라다2
LINK
#116324534
IP 223.♡.210.209
08-09 2020-08-09 21:18:13
·
@연을쫓는아이님 ^^ 누구보다 열심히 해주실 걸 알고 있습니다. 공부하시는 분들의 소중한 시간 아깝지 않게 나름 열심히 준비했는데, 괜히 조마조마하네요 ㅎㅎ 도움되시면 좋겠어요 아이님! 늘 감사합니다
thisman
LINK
#116320031
IP 58.♡.40.194
08-09 2020-08-09 18:24:27
·
강의 감사합니다.
프라다2
LINK
#116324539
IP 223.♡.210.209
08-09 2020-08-09 21:18:24
·
@thisman님 ^^ 감사합니다
누니엉아
LINK
#116320660
IP 223.♡.45.98
08-09 2020-08-09 18:56:13
·
오..필요하던 내용입니다. 감사합니다.
프라다2
LINK
#116324555
IP 223.♡.210.209
08-09 2020-08-09 21:18:54
·
@누니엉아님 강의에서 다루는 내용이 필요한 부분을 모두 충족하길 바랍니다 ㅎㅎ
언덕너머
LINK
#116320987
IP 125.♡.242.26
08-09 2020-08-09 19:11:56
·
구독해서 가끔 시간 날때 보는데 클리앙분 이시군요.
강의 감사합니다.
프라다2
LINK
#116324563
IP 223.♡.210.209
08-09 2020-08-09 21:19:06
·
@언덕너머님 ^^ 댓글 감사합니다.
Elgort
LINK
#116320998
IP 223.♡.131.103
08-09 2020-08-09 19:12:09
·
이 분야에 대해 알고 싶었는데. 감사합니다^^
프라다2
LINK
#116324573
IP 223.♡.210.209
08-09 2020-08-09 21:19:32
·
@Elgort님 시간은 길지만 막상 배워두고 나면 굉장히 쉽고 유용하게 써먹을 수 있을거에요 ㅎㅎ 감사합니다
삼겹살조아
LINK
#116321711
IP 121.♡.86.246
08-09 2020-08-09 19:37:05 / 수정일: 2020-08-09 19:38:19
·
.저두 시간 되면 나중에 한번 꼭 볼게요 ㅎ
프라다2
LINK
#116324581
IP 223.♡.210.209
08-09 2020-08-09 21:19:48
·
@삼겹살조아님 ^^ 언젠가 필요해지실때 찾아주세요!
PinkPanther
LINK
#116322004
IP 49.♡.121.34
08-09 2020-08-09 19:45:37
·
감사합니다. 필요한거만 검색해서 임시로 쓰고 있는데..
덕분에 제대로 이해하고 응용할 수 있겠네요.. 감사합니다. ^^
프라다2
LINK
#116324590
IP 223.♡.210.209
08-09 2020-08-09 21:20:21
·
@PinkPanther님 그 정도면 이미 절반 이상은 커버되실 것 같네요 ^^ 빠른 속도로 재생하시고 이미 아시는 부분은 맘껏 스킵해주세요 ㅎ
빌버
LINK
#116323688
IP 118.♡.88.222
08-09 2020-08-09 20:45:28
·
나중에 한번 도전해보겠습니다
좋은 강의 감사합니다~
프라다2
LINK
#116324595
IP 223.♡.210.209
08-09 2020-08-09 21:20:32
·
@빌버님 ^^ 감사합니다!
폴이바스
LINK
#116323786
IP 223.♡.203.127
08-09 2020-08-09 20:48:29
·
엄청 기다렸어요 감사합니다^^
프라다2
LINK
#116324619
IP 223.♡.210.209
08-09 2020-08-09 21:21:15
·
@폴이바스님 좀만 더.. 좀만 더 하다보니.. 한 2시간 강의 했겠지 했는데 5시간 반이나 되는걸 보고 기겁을 했습니다 ㅠㅠ 덕분에 편집에 검수에 시간이 꽤 걸렸네요, 늦어서 죄송합니다 ㅎㅎ 도움되길 바랄게요
구둔살
LINK
#116323951
IP 221.♡.151.20
08-09 2020-08-09 20:54:55
·
ㄷㄷㄷㄷ 여섯시간짜리 강의 준비하시는데 들인 시간이 어마어마할거같은데 이런 귀한 자료 감사드립니다..ㄷㄷㄷㄷ
프라다2
LINK
#116324639
IP 223.♡.210.209
08-09 2020-08-09 21:21:53
·
@구둔살님 시간 조절을 참 못하는 사람입니다 ㅠㅠ 2시간이면 충분하겠지 했는데 찍다보니 왕창 길어지네요. 시간 딱 딱 맞추는 교수님들이 새삼 대단해보입니다 ㅎㅎ 감사합니다
kirikae
LINK
#116324187
IP 112.♡.103.225
08-09 2020-08-09 21:04:04
·
정말 감사드립니다. 아이를 위한 아주 간단한 어플 만들어보고싶은데 이런 것도 매우 도움이 될 듯 합니다.
프라다2
LINK
#116324658
IP 223.♡.210.209
08-09 2020-08-09 21:22:31
·
@대디라이더님 아이를 위한 어플이라니.. 정말 스윗한 부모님이네요 ^^ 저도 늦기 전에 우리 애를 위한 게임 하나 만들어봐야겠습니다 ㅎㅎ
kirikae
LINK
#116324917
IP 112.♡.103.225
08-09 2020-08-09 21:31:44
·
@님 전혀 대단한 것은 아니고요 그저 다른 기능 없이 심플한 한글공부 정도면 됩니다. 근 시일내에 이룰 수 있는 계획은 아니고요, 바쁘기도 하고 실력도 없고 해서요. 이런 어플이 있으면 좋겠는데 특수교육용으로 잘 없더라고요.
응아달팽이
LINK
#116324404
IP 116.♡.31.93
08-09 2020-08-09 21:12:42
·
강의 정말 잘 보고 있습니다.
감사합니다!
프라다2
LINK
#116324664
IP 223.♡.210.209
08-09 2020-08-09 21:22:44
·
@응아달팽이님 ^^ 감사드립니다!
박스
LINK
#116324645
IP 121.♡.27.192
08-09 2020-08-09 21:22:00
·
크롤링과 웹스크랩핑이.. 명확하게 구분되어서 사용되나요?? 약간 혼용되어서 사용되는 느낌이 들어서요. 명확한 차이가 없다고 생각했는데 서두를 보니.. 많이 다르네요 ㅎㅎ
프라다2
LINK
#116324707
IP 223.♡.210.209
08-09 2020-08-09 21:24:21
·
@박스님 네, 특히 국내 많은 책들을 봤는데 많이들 혼용해서 쓰더라구요. 크게 구분지을 필요가 있을까 싶다가도 그래도 이왕이면 정확한 개념을 알려드리는게 좋을 것 같아서 초반에 조금 언급을 했습니다. ^^ 국내에서는 보통 웹크롤링이라고 칭하는듯 합니다.
박스
LINK
#116324691
IP 121.♡.27.192
08-09 2020-08-09 21:23:47
·
구독하려고 보니... 이미 구독중이었군요 ㅋㅋ ㅎㅎ ;; 이번건 꼭 봐야겠습니다 ㅋㅋ
프라다2
LINK
#116324719
IP 223.♡.210.209
08-09 2020-08-09 21:24:53
·
@박스님 ^^ 감사합니다. 언젠가 필요해지시면 보셔도 좋아요 ㅎㅎ
쟘스
LINK
#116325112
IP 157.♡.84.79
08-09 2020-08-09 21:38:19
·
좋은 강의 항상 잘 보고 있습니다. 감사합니다.
프라다2
LINK
#116325137
IP 223.♡.210.209
08-09 2020-08-09 21:39:31
·
@쟘스님 늘 감사드립니다! 편안한 주말 밤 되세요 ㅎㅎ
하이퍼구피
LINK
#116325221
IP 117.♡.17.194
08-09 2020-08-09 21:42:20
·
일단 감사인사부터!! 감사합니다.
프라다2
LINK
#116333951
IP 223.♡.210.209
08-10 2020-08-10 08:03:42
·
@하이퍼구피님 ^^ 제가 더 감사하지요
엽지기
LINK
#116325482
IP 220.♡.201.16
08-09 2020-08-09 21:52:00
·
재밌게 잘 보고있습니다

혹시 시간되면 크롤링과 저작권에대해서도 다뤄주시면 좋을거같아요

인터넷 기사 같은경우 저작권문제가 있어서 크롤링 데이터를 공식적으로 활용하기 어려운 점이 있는걸로 알고있습니다
프라다2
LINK
#116334011
IP 223.♡.210.209
08-10 2020-08-10 08:07:23
·
@엽지기님 좋은 말씀입니다. 크롤링을 하는 행위 또는 크롤링 해 온 데이터를 어떻게 활용하는지에 따라서 저작권 침해, 영업 방해 등 법적 분쟁이 발생할 수 있습니다. 특히 뉴스의 경우 크롤링이 아니더라도 그냥 사람이 본문 그대로 내용을 펌 했을 때도 문제가 될 수 있는 것으로 알고 있습니다. 그래서 강의 내용에서도 함부로 쓰지는 마십사 강조를 하고 있는데, 법적으로 잘 알지는 못하지만 관련 사례를 찾고 공부를 해서 기회가 되면 어디까지 크롤링을 할 수 있을지 영상으로 만들어 보겠습니다
인면조
LINK
#116325643
IP 49.♡.86.42
08-09 2020-08-09 21:57:52 / 수정일: 2020-08-09 21:58:04
·
구독하고 잘 보고있습니다. 나같은 문돌이도 할수 있다~!!
(요새.. 직장에서 저보고 파이썬 자동화 물어봐서.. 생활코딩이랑 나도코딩 추천중입니다....ㅋㅋ)
프라다2
LINK
#116334027
IP 223.♡.210.209
08-10 2020-08-10 08:08:02
·
@인면조님 히익 ^^;; 추천 감사드립니다
월천맨
LINK
#116325647
IP 58.♡.17.190
08-09 2020-08-09 21:57:57
·
좋은 강의 항상 잘 보고 있습니다.^^
정말 감사합니다.^^
프라다2
LINK
#116334032
IP 223.♡.210.209
08-10 2020-08-10 08:08:16
·
@월천맨님 ^^ 댓글 감사드립니다!
훼인잠만보
LINK
#116326502
IP 220.♡.118.218
08-09 2020-08-09 22:26:56
·
대학원에서 더듬더듬 배우고 있는데 저도 정주행 해보겠습니다 감사합니다!!
프라다2
LINK
#116334048
IP 223.♡.210.209
08-10 2020-08-10 08:08:44
·
@훼인잠만보님 조금 길지만 한번 훑고 나시면 훨씬 수월하실거에요 ^^
부릅뜨니숲이어쓰
LINK
#116326639
IP 14.♡.166.105
08-09 2020-08-09 22:31:27
·
브라보.
프라다2
LINK
#116334054
IP 223.♡.210.209
08-10 2020-08-10 08:09:03
·
@부릅뜨니숲이어쓰님 ㅋㅋ 감사합니다
술빨
LINK
#116327220
IP 222.♡.203.2
08-09 2020-08-09 22:48:30
·
이론 강좌 수백개보다 역시 실전 프로젝트 하나 해보는게 학습자 입장에서 최고로 와닿는 것 같습니다. 글 내용이나 강의 구성보니 굉장히 공들여서 하신 것 같아요! 최고입니다!!
프라다2
LINK
#116334060
IP 223.♡.210.209
08-10 2020-08-10 08:09:27
·
@술빨님 나름 신경 많이 썼는데 학습자분들께 잘 와닿았으면 하네요 ^^ 감사합니다
noyes
LINK
#116327354
IP 219.♡.76.61
08-09 2020-08-09 22:51:19
·
와 이분이 클리앙에 계셧군요! 정말 감사하게 잘 보고 있습니다. 기본 강의 보단 역시 실전이 중요하다고 생각하는 입장이라 정말 감사합니다.
프라다2
LINK
#116334062
IP 223.♡.210.209
08-10 2020-08-10 08:09:44
·
@neveress님 ^^ 클량 아잽니다...흑흑...
추억편
LINK
#116327435
IP 180.♡.247.41
08-09 2020-08-09 22:53:23
·
와.. 엄청나시네요.
요즘은 스크롤하면 동적으로 데이터 보여주게 바뀌는 추세 같더라구요;;
웹 크롤러와 스크래핑의 차이가 있을까요?
프라다2
LINK
#116334080
IP 223.♡.210.209
08-10 2020-08-10 08:10:52
·
@추억편님 크롤링은 주어진 페이지를 분석해서 안에 있는 링크들을 따라가며 웹들을 브라우징 하는 것, 스크래핑은 웹 페이지 내에서 어떤 데이터를 추출하는 것, 으로 구분지으면 됩니다만, 대개 크롤링으로 통칭하는듯 합니다.
추억편
LINK
#116346439
IP 180.♡.247.41
08-10 2020-08-10 14:22:06
·
아하 그렇군요.. 저도 사실 똑같은 것으로 알고 있었는데 스크래핑이라는 단어를 보니.. 궁금증이 생겨 질문 드렸었습니다. 말씀을 들어보니 이해가 더 잘 되네요.
UMP
LINK
#116327736
IP 125.♡.48.251
08-09 2020-08-09 23:02:42
·
코린이지만 도전해보렵니다
프라다2
LINK
#116334090
IP 223.♡.210.209
08-10 2020-08-10 08:11:05
·
@UMP님 ^^ 환영합니다!
chesterkoong
LINK
#116327800
IP 175.♡.13.60
08-09 2020-08-09 23:04:25
·
감사합니다. 나중에 정독해봐야겠어요
프라다2
LINK
#116334092
IP 223.♡.210.209
08-10 2020-08-10 08:11:16
·
@쿵이야님 시간나실때 봐주세요 ㅎ
Historia
LINK
#116327957
IP 223.♡.80.201
08-09 2020-08-09 23:09:11
·
메모 : 파이썬선생님
프라다2
LINK
#116334098
IP 223.♡.210.209
08-10 2020-08-10 08:11:27
·
@Historia님 ㅋㅋ 감사합니다
모찌링
LINK
#116328102
IP 220.♡.23.233
08-09 2020-08-09 23:12:55
·
구독중입니다. 크롤링 강의 감사드립니다~
프라다2
LINK
#116334106
IP 223.♡.210.209
08-10 2020-08-10 08:11:41
·
@모찌링님 구독 감사드립니다^^
Amor_Fati
LINK
#116328165
IP 118.♡.228.174
08-09 2020-08-09 23:14:44
·
대단하시네요.. 감사합니다.
프라다2
LINK
#116334110
IP 223.♡.210.209
08-10 2020-08-10 08:11:59
·
@묻혀갈나의인생아님 아닙니다 ㅎㅎ 좀 더 짧게 만들지 못해 걱정입니다..
지인빈현
LINK
#116328891
IP 122.♡.112.158
08-09 2020-08-09 23:39:23
·
애들과 구독중입니다.
좋은 내용 정말 감사드려요 ^^
프라다2
LINK
#116334113
IP 223.♡.210.209
08-10 2020-08-10 08:12:11
·
@지인빈현님 애들까지 ㅠㅠ 영광입니다!!
깨봉이
LINK
#116328898
IP 165.♡.105.177
08-09 2020-08-09 23:39:28
·
구독중입니다. 이렇게 체계적으로 컨튼츠 만들기가 어려울텐데, 항상 감사합니다.
프라다2
LINK
#116334633
IP 223.♡.210.209
08-10 2020-08-10 08:38:34
·
@깨봉이님 이크 아닙니다 ^^; 검수하면서 보니 구멍이 많아서 보충설명 메꾸느라 혼났네요 ㅎㅎ
3분21초
LINK
#116329144
IP 141.♡.166.213
08-09 2020-08-09 23:47:18
·
감사합니다. 그렇지 않아도 구독중이었는데, 열공하겠습니다
프라다2
LINK
#116334637
IP 223.♡.210.209
08-10 2020-08-10 08:38:50
·
@Nickyoon73님 구독 감사드립니다 ^^
영혼기병라젠카
LINK
#116329634
IP 119.♡.208.222
08-10 2020-08-10 00:02:39
·
와 감사합니다. !!!~~
프라다2
LINK
#116334641
IP 223.♡.210.209
08-10 2020-08-10 08:39:06
·
@영혼기병라젠카님 헉 ㅋㅋ 라젠카 오랜만에 듣네요, 감사합니다
바데니
LINK
#116330013
IP 61.♡.250.78
08-10 2020-08-10 00:18:52
·
어라?! 나도 코딩님이 클량 유져셨군요?! 너무너무 반갑습니다~~ 콘텐츠 정말 최고입니다!
프라다2
LINK
#116334656
IP 223.♡.210.209
08-10 2020-08-10 08:39:56
·
@바데니님 ㅋㅋㅋ 마른 오징어 먹는데 옆에서 와이프가 "동족을???" ... ㅠㅠ 클량인 맞습니다 ㅋㅋ 감사합니다
니부리드듣
LINK
#116330124
IP 220.♡.128.159
08-10 2020-08-10 00:22:48
·
스크랩핑을해서 외부에 서비스를 하게되었을데 법적문제는 없을까요?
프라다2
LINK
#116334698
IP 223.♡.210.209
08-10 2020-08-10 08:42:01
·
@니부리드듣님 문제가 아주 많습니다. 가져온 데이터를 학술용이나 개인 용도로 사용하는 것은 무방하지만 상업용으로 사용하시게 될 경우 큰일납니다. 일전에 구인구직 사이트 A 사가 B 사의 데이터를 긁어다가 써서 기사에도 오른 적이 있습니다. 이런 부분은 강의에서 모두 다루기는 힘들기 때문에 주의해서 쓰셔야합니다.
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB / 업로드 가능 확장자 jpg,gif,png,jpeg
지나치게 큰 이미지의 크기는 조정될 수 있습니다.
목록으로
글쓰기
글쓰기
목록으로 댓글보기 이전글 다음글
아이디·비번 찾기 회원가입
이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고
고객지원
  • 게시물 삭제 요청
  • 쪽지 신고
  • 닉네임 신고
  • 제보 및 기타 제안
개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책
©   •  CLIEN.NET