ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • (5) 지니 크롤링
    크롤링 2023. 7. 9. 17:00
    728x90
    # 지니 차트 200위 까지 크롤링
    # 반복문을 사용하여 크롤링
    # 수집한 데이터를 데이터프레임으로 만들고
    # 엑셀로 출력
    # 과제는 깃허브에 제출
    import requests
    from bs4 import BeautifulSoup as bs
    import pandas as pd
         
    data = []
    num = 1
    for j in range(1,5):
      header = {"User-Agent":
      "Mozilla/5.0 (Windows NT 10.0; Win64; x64)"}
      request = requests.get(site, headers=header)
      soup = bs(request.text)

      tds = soup.findAll('td', {'class':'info'})
      for i in range(len(tds)):
        title = tds[i].find('a', {'class':'title ellipsis'}).text.strip()
        artist = tds[i].find('a', {'class':'artist ellipsis'}).text.strip()
        print('{0:3d}위 {1} - {2}'.format(num, title, artist))
        dic = {'순위':num, '타이틀':title, '가수':artist}
        data.append(dic)
        num += 1
    df = pd.DataFrame(data)
    df.to_excel('genie_music.xlsx')

    '크롤링' 카테고리의 다른 글

    (4) 픽사베이 이미지 크롤링  (0) 2023.07.09
    (3) 인스타그램 크롤링  (0) 2023.07.09
    (2) 셀레니움  (0) 2023.07.09
    (1) 크롤링  (1) 2023.06.18

    댓글

Designed by Tistory.