이용시 궁금한 부분을 문의해주세요. 친절히 답변해 드리겠습니다.
제목 추출단어빈도 메뉴에서 단어 클릭시 나타나는 단어 트리 관련 질문입니다.
작성자 조재인 작성일 2017-03-23 11:54:28
첨부파일

너무너무 감사합니다.

데이터 분석 중에 있어 궁금한 부분이 있어 문의드립니다.


클리닝 -> 추출단어빈도 미리보기 클릭후
개별 추출단어마다 아래와 같이 링크된 페이지에서 제시되는 단어 트리 같은 이미지에 대하여 질문합니다.
(http://www.textom.co.kr/html_analysis/popup_chart/word_tree.php?idx=11734&mod=channel&query=도서관)

어떠한 근거로 추출된 그림인지요? 단어를 클릭하면 weight이 나오는데 어떠한 의미인지 궁금합니다.

단어와 단어의 동시출현횟수를 기반으로 계산된 것인지요?
어떻게 트리가 만들어 졌는지 알려주시고 weight이 산출된 근거도 말씀해 주시면 너무 감사하겠습니다.


프로그램 너무너무 잘쓰고 있고 매번 감사드립니다.


댓글 [1]
더아이엠씨 안녕하세요, 조재인님
문의주신 내용에 답변 드리겠습니다.

클리닝 -> 추출단어 미리보기 클릭후 단어마다 클릭해서 나오는 페이지의 워드트리에 대해 질문하셨는데요.

해당 페이지에 등장하는 "워드트리"의 경우 전체 문서의 분석결과가 아니라,
최대 문서수와 단어수를 제한하여 웹페이지에서 간단히 확인할 수 있도록 구성된 시각화 자료입니다.
결과적으로 수집된 문서에 대한 간략한 프리뷰를 제공하여 Cleaning(정제) 작업을 도와주기 위한 페이지입니다.

단어를 클릭하면 나오는 weight값은 해당 단어로 구성되는 총 문서의 양입니다만,
앞서 말씀드린바와 같이 최대 문서량, 단어의 수 등 제한을 통해 전체 문서에 대한 정확한 분석결과는 아닙니다.

그럼 문의에 대한 답변이 되셨기를 바랍니다.
저희 텍스톰에 관심을 가져주셔서 감사드리오며, 오늘도 건승하시길 기원합니다.

감사합니다. : 2017-03-24