Search
📝

[과제] 경제 뉴스 크롤링

네이버 증권의 뉴스 탭의 최신 10일 치 기사를 수집하여 데이터 프레임으로 생성하고, 데이터프레임을 article.csv 로 저장하시오.

네이버 증권 뉴스 탭

https://finance.naver.com/news/mainnews.naver?date=2024-06-27
Python
복사
날짜 별로 페이지가 구분되어 있고, 날짜를 변경할 경우, URL의 date의 속성값이 변경됨
각 날짜에는 페이지네이션으로 페이지가 변경됨
https://finance.naver.com/news/mainnews.naver?date=2024-06-27&page=6
Python
복사
페이지네이션은 고려하지 않고, 첫 페이지에 있는 데이터만 수집(페이지네이션 처리 여부는 옵션)

데이터 프레임 구조

다음과 같이 4개의 컬럼으로 구성됨
기사제목
본문url
기사본문
날짜
csv 파일로 저장 시, 인코딩(euc-kr 또는 cp949)하여 저장할 것

옵션

날짜 별 기사의 주요 키워드 빈도수 기반으로 추출하시오.