※ 상업성 광고, 저속한 표현, 특정인에 대한 비방, 정치적 목적이나 성향, 반복성이 있는 게시물, 게시판 성격과 다른 게시물 등은 관리자에 의해 통보없이 삭제되거나 이동될 수 있으며, 홈페이지를 통하여 불법유해 정보를 게시하거나 배포하면 정보통신망이용촉진 및 정보보호등에 관한 법률 제 74조에 따라 1년이하의 징역 또는 1천만원 이하의 벌금에 처해질 수 있습니다.

챗GPT 유료 사용법 모바일에서 워드 클라우드 (Word Cloud) 만들기

페이지 정보

작성자 Princess 댓글 0건 조회 11회 작성일 24-08-30 17:22

본문

​이번 워드클라우드 만들기 글은 셀레니움을 사용하는 것뿐만 아니라 긁어온 데이터를 분석까지 진행합니다!형태소 분석기는 설정할 게 많은 konlpy 대신 kiwi를 사용했습니다.python 3.10.14 워드클라우드 만들기 환경이고 jupyter(.ipynb)로 진행했습니다.대부분의 설명은 코드의 주석으로 작성되어 있습니다.[작업 순서]1. 특정 영화를 검색해서(selenium)2. 리뷰를 원하는 만큼 수집하고(selenium)3. 리뷰 분석해서(kiwi, 워드클라우드 만들기 krwordrank)4. 워드 클라우드 만들고 저장하기(plt, wordcloud)​우선 필요한 패키지를 한 번에 불러옵니다.패키지가 모두 불러와지는지 셀을 실행해서 확인하면서 진행해 주세요.패키지가 워드클라우드 만들기 정상적으로 불러와지면, 분석에 필요한 변수와 함수를 지정합니다.영화 이름이나 수집할 리뷰 개수는 원하는 대로 변경할 수 있습니다!​이제 셀레니움을 이용해서 워드클라우드 만들기 와차피디아 사이트를 열어줍니다.​영화를 검색하고 코멘트 더보기로 들어갑니다.​이제 원하는 개수만큼 리뷰와 평점을 긁어옵니다.tqdm을 사용해서 다음처럼 진행도를 확인할 수 있습니다.​우선 워드클라우드 만들기 평점을 한 번 확인해 볼까요!평균 4.2면 꽤 높네요!​저는 혹시 몰라 df를 우선 저장하고 다시 불러와서 사용하겠습니다.이 부분은 생략해도 워드클라우드 만들기 됩니다.​지금은 리뷰가 문장 형태이니, 필요한 명사 형태소(NNG 일반명사, NNP 고유명사, NP 대명사)만 추출해 줍니다.형태소 분석기는 kiwi를 사용했습니다. (kiwi 워드클라우드 만들기 github)​필요한 명사류만 추출했으니 100개의 리뷰에서 자주 언급된 키워드만 추출합니다.저는 최소 빈도수를 5로 지정했습니다.​추출한 키워드로 워드 클라우드를 만듭니다.plt로 시각화해서 워드클라우드 만들기 확인하고 png로 저장하고 마무리입니다.​

댓글목록

등록된 댓글이 없습니다.

※ 상업성 광고, 저속한 표현, 특정인에 대한 비방, 정치적 목적이나 성향, 반복성이 있는 게시물, 게시판 성격과 다른 게시물 등은 관리자에 의해 통보없이 삭제되거나 이동될 수 있으며, 홈페이지를 통하여 불법유해 정보를 게시하거나 배포하면 정보통신망이용촉진 및 정보보호등에 관한 법률 제 74조에 따라 1년이하의 징역 또는 1천만원 이하의 벌금에 처해질 수 있습니다..