혜빛의 Story

혜빛의 Story

  • 분류 전체보기 (57)
    • 자기계발 (17)
      • 공모전 및 자격증 (2)
      • 대외활동 (9)
      • Coursera (6)
    • 데이터 분석 (12)
      • R (7)
      • 파이썬 (5)
    • 뉴스 (28)
  • 홈
  • 태그
  • 방명록
RSS 피드
로그인
로그아웃 글쓰기 관리

혜빛의 Story

컨텐츠 검색

태그

데이터사이언티스트 에듀테크 인스타그램 빅데이터 금융데이터 데이터사이언스 데이터과학 파이썬 R 데이터3법 데이터 관광데이터 Melon 의료데이터 뉴스 AI 데이터분석 Python 핀테크 데이터 사이언스

최근글

댓글

공지사항

아카이브

시대별차트(3)

  • 2-3. 네트워크분석

    이전까지에서 정리한 시대별 어휘들을 통해 제가 따로 네트워크 분석을 진행해 보았습니다. 우선 시대별 전체 어휘로 네트워크를 그려보면 시대별 전체 어휘 네트워크를 살펴보면 1960년대와 2010년대가 연관성이 제일 낮고, 그 다음 2000년대, 1990년대 순으로 연도가년대와 멀어질수록 연관성이 낮아지는 것을 알 수 있었습니다. 즉, 연도에서 각각 뻗어나가는 선들을 봤을 때 가장 가까운 연대와의 연관성이 가장 크다는 것입니다. 장소 어휘를 통해 네트워크 분석을 진행하니 모든 어휘와는 다르게 1960년대 장소 어휘는 1970년대를 제외한 연도들과 연관성이 거의 없으며, 1960년대를 제외한 연도들은 시대별 전체 어휘 네트워크와 비슷하게 가까운 연대와의 연관성이 가장 크다는 것이 더 분명하게 나타납니다. 이렇..

    2020.07.29
  • 2-1. 데이터 수집 & 정리

    https://hyebit.tistory.com/23?category=903232 1-2. Melon 시대별 차트 크롤링 하기 앞서 https://hyebit.tistory.com/15?category=903232 1-1. 웹크롤링 준비하기 우선 저는 R selenium 패키지를 이용하였습니다. 제 주위 사람들 중에서 chromedriver만 설치하여도 가능한 사람이 있었고, 그렇게.. hyebit.tistory.com 멜론 노래 가사들을 크롤링하는데에 있어 앞서 사용했던 크롤링 코드와 바뀐부분이 있습니다. 노래 가사를 크롤링해오는 데 있어 결과들을 보니 깔끔하게 끊어져 있지 않아 코드를 수정하였습니다. 연도별로 데이터를 분할한 자료를 활용하여 문장부호는 제거하고, 명사만 추출하여 정리합니다. 여기까지 ..

    2020.07.29
  • 2. 1960년대 부터 2010년대 까지 대중가요 가사 속 장소 어휘 분석

    https://hyebit.tistory.com/13?category=903232 1. 멜론 시대별 차트를 크롤링 하여 가사에 사용하는 단어 알아보기! 이번에 제가 웹크롤링을 하여 중간 과제로 제출하는 것이 '빅데이터 분석 및 실습' 수업의 중간고사 이기 때문에 제가 자주 듣는 음악 사이트를 활용하여 웹 크롤링을 해보자 라는 생각을 하였�� hyebit.tistory.com 위에 글을 보시면 이전에 앞서 멜론 시대별 차트에 있는 노래 가사들을 활용하여 많이 사용된 단어들을 알아보고, 데이터 시각화를 진행했었습니다. 이번에는 기말고사 팀프로젝트로 위의 크롤링 방법을 활용하여 1960년대부터 2010년대까지 대중가요 가사 속 장소 어휘 분석을 진행하였습니다. 이 주제로 선정한 이유로는 멜론 차트에 있는 노래..

    2020.07.29
이전
1
다음
티스토리
© 2018 TISTORY. All rights reserved.

티스토리툴바