- vito api, google api, clova api
- 셋중 vito로 사용하기로함, 가성비가 좋으며, 우선적으로 무료이고, 구어체 학습모델이라 회의 내용을 잘 받아준다.
- AI hub에서 회의 데이터 수집
- Kospeech 패키지를 통해 모델 학습
- 전이학습 진행
- 네이버 (블로그, 카페) 크롤링 진행
- 약 1만건의 본문을 스크랩 후 정규화 & 토큰화 진행
- 출현 빈도수에 비례하여 단어가 커지도록 설계
- 주목하고 있는 문자색을 바꿔서 눈에 띄도록 설정
- KoNLP를 활용하여 회의중 나온 문장에서 단어들을 추출해냄
- word2vec을 계산하여 중요도가 높은 단어를 추출
- 추출된 단어들을 검색하여 다양한 정보를 유저에게 제공
- LSTM 모델을 활용하여 자연스러운 문장을 생성해줌
- 이미 학습된 패키지를 활용하여 진행
- clova api를 활용하여 축약된 정보를 제공하기도 함 ( 하지만 유로임.. )