혜빛의 Story

혜빛의 Story

  • 분류 전체보기 (57)
    • 자기계발 (17)
      • 공모전 및 자격증 (2)
      • 대외활동 (9)
      • Coursera (6)
    • 데이터 분석 (12)
      • R (7)
      • 파이썬 (5)
    • 뉴스 (28)
  • 홈
  • 태그
  • 방명록
RSS 피드
로그인
로그아웃 글쓰기 관리

혜빛의 Story

컨텐츠 검색

태그

R 핀테크 데이터3법 뉴스 의료데이터 Melon 파이썬 데이터 데이터 사이언스 데이터분석 데이터사이언티스트 금융데이터 AI 인스타그램 에듀테크 Python 데이터과학 데이터사이언스 빅데이터 관광데이터

최근글

댓글

공지사항

아카이브

분석(3)

  • 2-2. 장소어휘 사전 분석 & 시각화

    앞서 정리하여 직접 만든 장소 어휘 사전을 활용하여 시대별 언어분석을 진행하였습니다. 이와 같이 연도별 장소 어휘를 filter함수를 활용하여 추출하여 정리하였고, 시대별 시대성을 잘 나타내는 어휘를 시각화하여 나타내면 위의 코드를 활용하여 시각화를 하면 시각화하여 나타낸 그림을 보면 2000년대 이후부터 노래 가사에 영어가 많이 등장하기 시작하였다는 것을 알 수 있습니다. 위에서 정리한 장소 어휘를 통해 시각화를 하니 1960년대에는 항구, 지평선, 수평선 1970년대는 목화밭, 시골, 고향 1980년대는 돌담길, 덕수궁 1990년대는 학교 / 2000년대는 비행기 2010년대는 인스타그램의 시대별로 대표적인 단어들을 알아볼 수 있었습니다. 위의 제가 시각화 한 그래프와 팀원들이 시대별 상황을 조사한 ..

    2020.07.29
  • 2-1. 데이터 수집 & 정리

    https://hyebit.tistory.com/23?category=903232 1-2. Melon 시대별 차트 크롤링 하기 앞서 https://hyebit.tistory.com/15?category=903232 1-1. 웹크롤링 준비하기 우선 저는 R selenium 패키지를 이용하였습니다. 제 주위 사람들 중에서 chromedriver만 설치하여도 가능한 사람이 있었고, 그렇게.. hyebit.tistory.com 멜론 노래 가사들을 크롤링하는데에 있어 앞서 사용했던 크롤링 코드와 바뀐부분이 있습니다. 노래 가사를 크롤링해오는 데 있어 결과들을 보니 깔끔하게 끊어져 있지 않아 코드를 수정하였습니다. 연도별로 데이터를 분할한 자료를 활용하여 문장부호는 제거하고, 명사만 추출하여 정리합니다. 여기까지 ..

    2020.07.29
  • 2. 1960년대 부터 2010년대 까지 대중가요 가사 속 장소 어휘 분석

    https://hyebit.tistory.com/13?category=903232 1. 멜론 시대별 차트를 크롤링 하여 가사에 사용하는 단어 알아보기! 이번에 제가 웹크롤링을 하여 중간 과제로 제출하는 것이 '빅데이터 분석 및 실습' 수업의 중간고사 이기 때문에 제가 자주 듣는 음악 사이트를 활용하여 웹 크롤링을 해보자 라는 생각을 하였�� hyebit.tistory.com 위에 글을 보시면 이전에 앞서 멜론 시대별 차트에 있는 노래 가사들을 활용하여 많이 사용된 단어들을 알아보고, 데이터 시각화를 진행했었습니다. 이번에는 기말고사 팀프로젝트로 위의 크롤링 방법을 활용하여 1960년대부터 2010년대까지 대중가요 가사 속 장소 어휘 분석을 진행하였습니다. 이 주제로 선정한 이유로는 멜론 차트에 있는 노래..

    2020.07.29
이전
1
다음
티스토리
© 2018 TISTORY. All rights reserved.

티스토리툴바