※ 상업성 광고, 저속한 표현, 특정인에 대한 비방, 정치적 목적이나 성향, 반복성이 있는 게시물, 게시판 성격과 다른 게시물 등은 관리자에 의해 통보없이 삭제되거나 이동될 수 있으며, 홈페이지를 통하여 불법유해 정보를 게시하거나 배포하면 정보통신망이용촉진 및 정보보호등에 관한 법률 제 74조에 따라 1년이하의 징역 또는 1천만원 이하의 벌금에 처해질 수 있습니다.

챗GPT 유료 사용법 모바일에서 워드 클라우드 (Word Cloud) 만들기

페이지 정보

작성자 Denise 댓글 0건 조회 45회 작성일 24-08-29 11:29

본문

1. 워드클라우드 만들기 기본 패키지 설치아래 코드를 실행해 워드클라우드에 필요한 패키지를 설치하자어디에 설치되는지 위치 확인하시길!혹시라도 anaconda3에 설치되지 않고 python경로에 설치가 된다면 따로 import를 해줘야 한다​2. 원하는 워드클라우드 만들기 단어를 검색하는 뉴스 URL 생성​이건 HTTP를 가져오기 위한 라이브러리그 후 내가 선택한 검색어를 검색하는 url을 입력한다.이 때 url은 반드시!! UTF-8로 인코딩되어야 함생성을 하게 워드클라우드 만들기 되면 입력한 단어를 검색하는 링크가 생성됨여기서는 '안녕'이라는 단어를 입력함!​​3. 정적 HTML 가져온 뒤 원하는 데이터 파싱​1) 원하는 데이터를 파싱하는 라이브러리인 BeautifulSoup를 임포트 후 워드클라우드 만들기 인스턴스를 생성한다2) 선택자 찾기(1) 위에서 구한 target_url에 들어간 후 개발자 도구 열기(2) 개발자 도구에서 아래 아이콘 클릭 후 크롤링하고 싶은 곳 클릭(3) 아래 워드클라우드 만들기 그림처럼 클릭한 곳의 HTML 코드가 나오게 되는데 이 부분 우클릭 -&gtCopy -&gtCopy selector 순으로 작업하면 선택자 코드가 복사됨!여기서는이 부분을 가져왔고, 선택자는 #contents &gtdiv 워드클라우드 만들기 &gtdiv &gtdiv.divide_area &gtsection &gtdiv.sch_tab &gtul &gtli.tab_list_node.is_active &gtbutton &gta &gtspan이렇게 나오는데 맨 끝에 있는 button &gta &gtspan만 가져와서 사용했다​3) 전체 기사 개수 찾아오기4) 읽어올 워드클라우드 만들기 데이터 개수 입력 받아 읽어올 페이지의 개수(page_num) 생성하기​4. 텍스트 파일 생성 후 파싱한 데이터(기사 링크) 저장여기까지 하면 C:\Users\USER 경로에 '(내가입력한검색어).txt'파일이 생성된다!안녕​5. 텍스트 파일에서 워드클라우드 만들기 명사(한글 형태로 분석) 추출​1) 한국어 형태소 분석기인 Kkma를 사용해 추출하기2) 검색어가 포함된 기사 찾기​6. 워드클라우드 생성실행 결과는 다음과 같다! 읽어오는 데이터 개수마다 실행 워드클라우드 만들기 결과가 다르게 나올 것이다신기하당​

댓글목록

등록된 댓글이 없습니다.

※ 상업성 광고, 저속한 표현, 특정인에 대한 비방, 정치적 목적이나 성향, 반복성이 있는 게시물, 게시판 성격과 다른 게시물 등은 관리자에 의해 통보없이 삭제되거나 이동될 수 있으며, 홈페이지를 통하여 불법유해 정보를 게시하거나 배포하면 정보통신망이용촉진 및 정보보호등에 관한 법률 제 74조에 따라 1년이하의 징역 또는 1천만원 이하의 벌금에 처해질 수 있습니다..