[NLP자연어처리]
시즌3 NLP : 피처 추출과 피처 엔지니어링
- 2022-02-28 의견나누기 0
[ 시즌3 : NLP 003회 ]
2022년 2월 28일 월요일
회사 세미나 시즌3
주제는 NLP(자연어처리)이다.
2월부터 시작했다.
매주 월요일마다 했다.
세 번째 시간을 가졌다.
오전 9시 30분부터 11시까지 진행했다.
직원들이 교대로 발표를 한다.
3월부터는 격주로 할 예정이다.
외부에서도 줌으로 참석한다.
대전에 있는 연구원의 책임연구원 1명,
대학교 교수 1명, 해당 대학원생 1명이다.
오늘 내용은 다음과 같다.
1. 텍스트에서 피처 추출
1.1 원시 텍스트에서 일반적인 피처 추출
1.2 단어 모음
1.3 지프의 법칙
1.4 TF-IDF
2. 피처 엔지니어링
2.1 텍스트 유사도 : 코사인 유사도, 자카드 유사도
2.2 단어 구름
2.3 다른 시각화 방법들
Comment 0