본문 바로가기
[컨설팅] 정보보안,시큐어코딩,해킹

[링크] 구글 스프레드 시트 활용한 웹 크롤링 하기

by milkclub 2020. 4. 18.
728x90

보안관제 업무 중 한가지가

보안뉴스 등을 주기적으로 (30분~1시간) 확인하여 새로 게시물이 올라올 경우

그것을 퍼다가 내부에 공유하는 일을 하게 된다.

수동으로 하기 너무 귀찮아 웹 크롤링을 생각하게 되는데

간단하고 쉽게 만드는 건 파이썬이라고 하지만 설치도 귀찮을때 활용하는 방법

바로 구글 스프레드 시트를 활용하는 방법이다.

 

7년전 구글 스프레드 시트를 활용하여 SITEMON - 웹사이트 모니터링 을 해본적이 있어서

더 쉽게 접근할 수 있었다.

 

방법은 인터넷 검색하여 링크로 남기고 나중에 정리하자.

 

>> 시도해본 결과 구글 드라이브가 보안에 막혀서 정상적으로 시도하지 못함. ㅠㅠ

보안에 막혀있는 경우를 제외하고는 쓸만한 방법이니 참고자료로만 활용할 것

 

https://steemit.com/kr/@youngbinlee/5-importxml

 

구글시트 강좌5 IMPORTXML로 하는 더 파워풀한 웹크롤링 — Steemit

2018년에도 구글 시트 강좌와 함께하는 @youngbinlee 빈누입니다. 구글시트 강좌1 IMPORTHTML로 한방에 하는 웹페이지 크롤링 구글시트 강좌2 CONCATENATE 함수로 원하는… by youngbinlee

steemit.com

 

https://cafe.naver.com/kkutukorea/42227

 

[크롤링] 구글 시트를 활용한 초간단...

크롤링이라는걸 들어보셨나요? 크롤링이란, 웹 페이지의 내용중 원하는 데이터만 추출하는 ...

cafe.naver.com

https://m.post.naver.com/viewer/postView.nhn?volumeNo=11697606&memberNo=33264526&vType=VERTICAL

 

구글 스프레드시트에서 웹 크롤링하기 - importjson 활용법.

[BY InSpirit] 웹 스크래핑과 크롤링으로 가장 많이 쓰이는 건 아무래도 Python일 겁니다. 라이브러리...

m.post.naver.com

 

728x90