네이버 뉴스 자동 저장 프로그램 소스 코드 분석
이번 글에서는 핵마피아 꼼짝마 프로젝트를 위해 만든 프로그램의 소스 코드를 분석합니다. [네이버 뉴스 자동 저장 프로그램] 에 관한 설명은 이전 글 에서 확인할 수 있습니다. 각 단계별 동작 요약 - 일괄 검색 : OR 연산자를 사용하여 검색어 1개라도 포함된 기사를 모두 검색 - 개별 검색 : 검색어를 1개씩 나눠서 기사를 검색하여 기사에 포함된 검색어를 확인 - 검색 결과 병합 : 개별 검색에서 확인한 기사에 포함된 검색어를 일괄 검색 결과에 추가 - 형태소 분석 : 기사 제목의 형태소를 분석하여 많이 사용된 단어를 확인 - 엑셀 저장 : 검색 결과와 형태소 분석 결과를 엑셀 파일에 저장 - 올리기 : 엑셀 파일을 구글 드라이브에 올림 개발 환경 프로그램 개발 언어는 파이썬 을 사용했습니다. 파이썬 개발 환경은 윈도우10에 아나콘다 를 설치해서 준비했습니다. 아나콘다를 설치하면 함께 설치되는 주피터 로 코딩을 했습니다. 추가로 설치한 라이브러리는 아래 <함수 설명>에 정리되어 있습니다. 함수과 라이브러리 naver_news_crawling(keyword, search_period = datetime.today()) 일괄 검색 함수 - raquests , BeautifulSoup 라이브러리 사용 naver_news_crawling_oneKeyword(keyword, search_period = datetime.today()) 개별 검색 함수 - raquests, BeautifulSoup 라이브러리 사용 news_list_merge(allKeyword_newsList, oneKeyword_newsList) 검색 결과 병합 함수 hangeul_morpheme_analyser(newslist) 행태소 분석 함수 - konlpy 라이브러리 사용 news_list_write_to_exelfile(keyword, newslist, keywords_count, search_period, work_time, e...