임베딩벡터로 만들고 벡터간 유사도 검색을 해서 일정 수준 이상이면 중복 = 공통점, 이런 식으로 판별할 수는 있을 것 같네요. 개념적으로는 충분히 가능해 보입니다. 하지만 실제로 코드 짜는 건 전혀 다른 일이라... 아마 쓸만한 툴이 이미 나와있을 거예요. 문제는 그걸 찾는 거...
겨울의검
IP 222.♡.121.49
05-29
2023-05-29 12:39:40
·
vision + nlp 태스크라서.....
캐글에 보시면 그래프들을 타뷸라 데이터로 만드는 컴프티션이 있는데, 이게 부분적으로나마 도움이 될 것 같네요.
캐글에 보시면 그래프들을 타뷸라 데이터로 만드는 컴프티션이 있는데, 이게 부분적으로나마 도움이 될 것 같네요.
https://www.kaggle.com/competitions/benetech-making-graphs-accessible
여기에 OCR, topic modeling 등등 쓰면... 될 것 같기도 하구요;