본문바로가기


페이지 위치

블로그

Home 블로그

블로그






[전체] 리스트

블로그
제목 등록일
[NLP자연어처리]  시즌3 NLP : 피처 추출과 피처 엔지니어링  (0) 2022-02-28
[이부일의 칼럼]  데이터에 기반한 문제 해결형 강의  (0) 2022-02-25
[이부일의 칼럼]  대전환의 시기 : 대전의 정체성은 무엇인가?  (0) 2022-02-23
[이부일의 칼럼]  대전을 인공지능 또는 데이터의 중심으로  (0) 2022-02-23
[강의]  데이터 분석과 활용  (0) 2022-02-18
[자문]  알아두면 쓸데있는 人을 잡아라 스타트업 컨퍼런스  (0) 2022-02-18
[MOU]  (주)통계마당  (0) 2022-02-11
[뉴스]  대동대, 4차산업연계 미래인재양성 교육 성료  (0) 2022-02-04
[이부일의 칼럼]  데이터를 분석한다는 것은?  (0) 2022-01-28
[이부일의 칼럼]  AI 시대, 누가 인재인가? : 1편  (0) 2022-01-21

[NLP자연어처리]

시즌3 NLP : 피처 추출과 피처 엔지니어링

  • 2022-02-28   의견나누기0

[ 시즌3 : NLP 003회 ]

 

2022년 2월 28일 월요일

 

회사 세미나 시즌3

주제는 NLP(자연어처리)이다.

 

2월부터 시작했다.

매주 월요일마다 했다.

세 번째 시간을 가졌다.

오전 9시 30분부터 11시까지 진행했다.

직원들이 교대로 발표를 한다.

3월부터는 격주로 할 예정이다.

 

외부에서도 줌으로 참석한다.

대전에 있는 연구원의 책임연구원 1명,

대학교 교수 1명, 해당 대학원생 1명이다.

 

오늘 내용은 다음과 같다.

1. 텍스트에서 피처 추출

1.1 원시 텍스트에서 일반적인 피처 추출

1.2 단어 모음

1.3 지프의 법칙

1.4 TF-IDF

 

2. 피처 엔지니어링

2.1 텍스트 유사도 : 코사인 유사도, 자카드 유사도

2.2 단어 구름

2.3 다른 시각화 방법들

빠른메뉴



페이지 맨 위로 이동