[라이선스 면] 아... 이놈들 진짜 미친놈들이네요... 나라돈으로 연구해서 모델 냈으면 그냥 풀어야지... 말도 안되는 조건을 걸었네요;; "본 한국어 BERT 언어모델이 협약자로 인해 유출되어 문제가 발생하였을 경우 본 한국어 BERT 언어모델의 협약자는 전적으로 민, 형사상의 모든 법적 책임을 부담해야 합니다."
[퀄리티] 몇몇개 API살펴 봤는데 쓰레기네요 이거가지고 제대로 된 서비스나 의미 있는 논문은 못만들어요; 사이트에서 "데모" -> "질의응답 기술" 들어가서 테스트 해보시면 이게 얼마나 쓰레기 인지 알 수 있습니다. "오늘 예약 가능한가요" 라는 질문을 넣으면 답변을 하기위한 기초 데이터로 분류가 되어야 하는데;; 그냥 파싱하고 그것도 정확하게 해내지 못하네요;;; 최악
dosuser
IP 218.♡.27.39
11-03
2019-11-03 23:27:54
·
"어휘간 유사도 분석" 신조어 분류가 전혀 안되는 구조라;; '레드벨벳'과 'SES' 의 상위 노드는 '과일'이라네요;;; 로봇과 머신의 분류 역시 과일입니다.
dosuser
IP 218.♡.27.39
11-03
2019-11-03 23:30:46
·
그냥 mecab ko 사용하고 추가적으로 근래 나온 라이브러리들 붙이는게 훨 좋은 퀄리티를 보장할것 같네요... 진짜 더러운 놈들...
도 있습니다
위키백과 덤프
https://ko.wikipedia.org/wiki/%EC%9C%84%ED%82%A4%EB%B0%B1%EA%B3%BC:%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B2%A0%EC%9D%B4%EC%8A%A4_%EB%8B%A4%EC%9A%B4%EB%A1%9C%EB%93%9C
나무위키 덤프
https://namu.wiki/w/%EB%82%98%EB%AC%B4%EC%9C%84%ED%82%A4:%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B2%A0%EC%9D%B4%EC%8A%A4%20%EB%8D%A4%ED%94%84
도 은근 쓸만합니다.
"본 한국어 BERT 언어모델이 협약자로 인해 유출되어 문제가 발생하였을 경우 본 한국어 BERT 언어모델의 협약자는 전적으로 민, 형사상의 모든 법적 책임을 부담해야 합니다."
사이트에서 "데모" -> "질의응답 기술" 들어가서 테스트 해보시면 이게 얼마나 쓰레기 인지 알 수 있습니다.
"오늘 예약 가능한가요" 라는 질문을 넣으면 답변을 하기위한 기초 데이터로 분류가 되어야 하는데;; 그냥 파싱하고 그것도 정확하게 해내지 못하네요;;; 최악
신조어 분류가 전혀 안되는 구조라;; '레드벨벳'과 'SES' 의 상위 노드는 '과일'이라네요;;;
로봇과 머신의 분류 역시 과일입니다.
진짜 더러운 놈들...
혹시 재직자분들이 보실까봐 대놓고 까진 못했는데 ㅠㅠ
/N☢️JAPAN 😱