-
(5) 지니 크롤링크롤링 2023. 7. 9. 17:00728x90# 지니 차트 200위 까지 크롤링# 반복문을 사용하여 크롤링# 수집한 데이터를 데이터프레임으로 만들고# 엑셀로 출력# 과제는 깃허브에 제출import requestsfrom bs4 import BeautifulSoup as bsimport pandas as pddata = []num = 1for j in range(1,5):header = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64)"}request = requests.get(site, headers=header)soup = bs(request.text)
tds = soup.findAll('td', {'class':'info'})for i in range(len(tds)):title = tds[i].find('a', {'class':'title ellipsis'}).text.strip()artist = tds[i].find('a', {'class':'artist ellipsis'}).text.strip()print('{0:3d}위 {1} - {2}'.format(num, title, artist))dic = {'순위':num, '타이틀':title, '가수':artist}data.append(dic)num += 1df = pd.DataFrame(data)df.to_excel('genie_music.xlsx')'크롤링' 카테고리의 다른 글
(4) 픽사베이 이미지 크롤링 (0) 2023.07.09 (3) 인스타그램 크롤링 (0) 2023.07.09 (2) 셀레니움 (0) 2023.07.09 (1) 크롤링 (1) 2023.06.18