본문 바로가기
2021 동계 모각코/개인 목표 및 회고

제 2회 모각코 회고

by 씀씀이00 2021. 1. 7.

셀레니움으로 공유마당에 있는 피피티와 태그를 수집하려고 계획했는데 크롤링이 막혀있는지 실행이 되지 않았다. 코딩 오류인줄 알고 헤매다가 아닌걸 알고 하나씩 다운받고 태그들을 csv 파일로 저장했다. 자료양이 많아서 수작업으로 하면 시간이 오래 걸릴 것 같다.. 아래처럼 피피티 경로와 핵심 키워드를 정리하고 있다.

 테스트 피피티에서 뽑은 핵심 키워드를 위의 키워드와 매칭시켜 적절한 템플릿을 추천하도록 개발할 것이다. 핵심 키워드를 매칭시킬 때 Word2vec을 이용해(아래 링크 참고) 측정한 유사도로 매칭시키면 될 것 같다. 더나은 라이브러리나 알고리즘을 찾으면 변경될 수도 있다.

https://colab.research.google.com/github/yooseonghwan/OpenDataWrangling/blob/master/03_word2vec%EC%9C%BC%EB%A1%9C_%EB%8B%A8%EC%96%B4%EC%9C%A0%EC%82%AC%EB%8F%84_%EB%B3%B4%EA%B8%B0_teacher.ipynb#scrollTo=Z8nV_ihUTnqx

 

Google Colaboratory

 

colab.research.google.com

 

'2021 동계 모각코 > 개인 목표 및 회고' 카테고리의 다른 글

제 3회 모각코 회고  (0) 2021.01.11
제 3회 모각코 목표  (0) 2021.01.11
제 2회 모각코 목표  (0) 2021.01.07
제 1회 모각코 회고  (0) 2021.01.04
제 1회 모각코 목표  (0) 2021.01.04