대학원일기3 분류성능평가지표 https://sumniya.tistory.com/26 분류성능평가지표 - Precision(정밀도), Recall(재현율) and Accuracy(정확도) 기계학습에서 모델이나 패턴의 분류 성능 평가에 사용되는 지표들을 다루겠습니다. 어느 모델이든 간에 발전을 위한 feedback은 현재 모델의 performance를 올바르게 평가하는 것에서부터 시작합니 sumniya.tistory.com 이과공부를 시작하면서 처음 접하게 되는 부분이 실험과 검증이었다. 문과를 자신의 의견이나 감상을 사람들에게 설명하는데, 이과의 공부는 자신의 이론을 실험하고 그 실험을 검증하더라. 여러가지 지표가있지만, 쉽게 접하게 되는 지표가, ROC와 AUC 등이 있는데, 블로그로 많은 글들을 찾아 보았지만, 정말 잘 정리가 되.. 2021. 3. 12. 논문정리_Frequent item set mining(Christian Borgelt∗) MLA Grahne, Gösta, and Jianfei Zhu. "Fast algorithms for frequent itemset mining using fp-trees." IEEE transactions on knowledge and data engineering 17.10 (2005): 1347-1362. 개인적인 목적으로 읽으면서 조금씩 정리해가려고 합니다. 논문은 구글 스콜라에서 검색하실 수 있습니다. 이 논문은 frequent item set mining에 대한 survey 논문이라고 볼 수 있는데요. 논문에서는 개념 정의와 기본적인 개념 그리고 핵심적인 업무에 대해 쓰여있습니다. 여러 개의 소제목으로 이루어져 있는데, 필요한 것부터 하나씩 읽어나가면서 정리해가려고 합니다. Introducti.. 2020. 7. 3. python_nlp_문장추출_txt문서_with 저는 대학원에서 nlp관련 연구를 하고 있는데, 문서를 가지고 하는 작업 중 전처리보다 먼저 하는 작업이 python에 문서를 로드하는 일입니다. 항상 할 때마다 "python에 txt문서 입력하기"를 검색하는데요. 저랑 비슷한 분들은 보시고 도움이 되셨으면 해서 적어봅니다. with open("파일주소", "rt", encoding='UTF8') as file: text=file.read() 이렇게 입력하게 되면 txt 파일을 줄 바꿈 없이 한 줄로 읽어 들인다는 뜻입니다. 위의 코드처럼 된다면 text(변수명)에 한 줄로 텍스트 파일이 할당됩니다. text변수를 콘솔에 출력해보면, 이런 모습으로 출력이 되는데요, 문장별로 나누기 전에 거슬리는 부분이 있습니다. \n 모양이 엄청나게 많이 있다는 걸 금.. 2020. 7. 3. 이전 1 다음