@하품고기님 '자료'랑 '데이터'가 뜻은 같지만 실제 사용에 국내에서 사용하는 뉘앙스 자체는 많이 다른 느낌이죠. 데이터과학을 자료과학으로 쓰진 않으니까요. 이미 '공공데이터포털'이라던가, '서울 열린데이터광장'처럼 데이터는 자료와는 다르게 사용되고있습니다. 많은 대학에서도 통계학과에 데이터과학이 추가되어 데이터과학과도 많이 생기고있구요
하품고기
IP 182.♡.236.22
10-11
2025-10-11 23:41:22
·
@님 30년넘게 프로그래밍하며 살아서 외래어에 익숙하고 저도 그게 더 편하지만 정부부처 이름에 데이터를 굳이 넣을 필욘 없어보입니다. 자료라는건 예시를 든 것이고 얼마든지 다른 말을 쓸 수 있을겁니다. 굳이 필요하지 않고 데이터라는 단어가 저 부처가 하는 일을 정확히 표현하는 것도 아닐거라서 굳이? 라는 생각이 드는게 사실입니다.
IP 59.♡.197.246
10-12
2025-10-12 00:38:46
·
@하품고기님 기존의 통계청도 결국 자료를 기반으로 전문적인 통계학 기법을 통한 자료 산출인데, 요즘시대에 고전적인 통계학에 데이터처리도 중요해졌죠. 즉 '데이터'라는 단어에는 데이터의 원 자료도 있지만 그걸 처리하는 방법, IT기술적인 정책 결정, AI정책, 빅데이터 정책등의 모든걸 함의하는 단어가 됩니다. 그걸 한번에 처리할 한국어는 없을거같아요.
@하품고기님 한글날하고 아무 관계없는 문제죠. 국가자료처는 순우리말인가요? 國家資料處에는 우리말이 한 자도 없습니다. 한글로 썼을뿐 한자어나 영단어나 전부 외래어인건 매한가지죠. 정부부처 이름은 무조건 한자어 기반으로 써야하는 것도 아니고, 그냥 낯섬에서 오는 편견입니다. 데이터라는 단어가 해당 부처에 맡기려고 하는 일을 정확하게 나타내는 이름이에요.
하품고기
IP 182.♡.236.22
10-12
2025-10-12 23:19:56
·
@네디언님 한자어는 우리말이죠. 데이터는 외래어로 우리말 범주이긴 하겠지만 버스처럼 대체가 불가능한가? 라고 하면 그렇지 않다는 느낌입니다. 이런 식으로 동사무소가 주민센터가 되고 그렇게 흘러가는거죠.
아날로그맨
IP 61.♡.121.188
10-11
2025-10-11 23:25:33
·
데이터라니... 와 대단하네요.
버드런트러셀
IP 222.♡.47.208
10-11
2025-10-11 23:42:56
·
지식 재산의 범위에는 특허 뿐 아니라 상표, 디자인 등이 포함되므로 바뀐 이름이 특허청의 업무 범위 비추어 더 폭넓은 의미를 띄는 정확한 명칭이 맞고, 데이터에 대해서는 AI, 빅데이터 시대에 부처의 방향을 제시하기 위함이었다고 생각합니다. '통계'는 raw데이터의 후처리 결과이고 '자료'도 AI의 시대에 데이터와는 의미가 좀 상이하죠.
N.C.
IP 223.♡.194.6
10-11
2025-10-11 23:44:47
·
특허라는 명칭은 바뀌기는 해야 합니다.
너키빅키잔아
IP 121.♡.250.40
10-12
2025-10-12 00:43:44
·
국립국어원에 물어보면 어떤 의견을 줄지 궁금했습니다. ㅎㅎㅎ (여전히 동사무소라고 하는 1인)
시카고핫도그
IP 73.♡.170.68
10-12
2025-10-12 07:18:40
·
통계는 데이터를 가공해서 의미 있는 지표로 만드는 과정이고 데이터 자체가 의미가 있는게 아닌데 마치 데이터가 많기만 하면 무언가 가르침을 줄것 같은 착각을 일으킬것 같네요
@시카고핫도그님 딥러닝 방법론이 대두된 이후부터는 데이터의 충분한 양과 질만 보장된다면 통계로 가공하기 이전의 raw 데이터가 많기만 해도 데이터 자체에 내재된 정보량을 통해 가르침을 줍니다. 빅데이터가 강조되는 이유도 그거고 국가적으로 데이터 자체에 중점을 두는 이유도 그거에요.
@시카고핫도그님 특히나 트랜스포머 기반의 멀티모달 LLM 부상 이후부터는 정형데이터의 통계처리보다 텍스트, 문서, 이미지 등 비정형 원천 데이터의 양과 질을 확보하는 것이 훨씬 중요해졌습니다. 이번에 통계청을 국가데이터처로 승격시킨 이유도 단순 정형데이터 통계처리를 넘어 정형/비정형을 아우르는 빅데이터 기반을 확보/유지/보강/가공하는 업무를 맡기기 위해서에요.
시카고핫도그
IP 73.♡.170.68
10-12
2025-10-12 20:31:53
·
@네디언님 머신러닝에 대해 저와 정 반대의 생각을 가지고 계시네요 저는 오히려 데이터에 대한 명확한 이해 없는 머신러닝이야 말로 가장 위험한 에러를 수반한다고 생각합니다 데이터에 대한 인간의 곡해와 호도죠 데이터가 많으면 그 안에 내재된 정보가 많다. 라는 말은 동어 반복이죠 그 정보를 어떻게 해석해야 맞느냐에 대해서는 머신러닝은 답을 줄 수 없습니다 LLM도 사람이 얼마나 많이 튜닝해야 결과가 나오는데요
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB / 업로드 가능 확장자 jpg,gif,png,jpeg,webp 지나치게 큰 이미지의 크기는 조정될 수 있습니다.
지재처
국데처
라고 읽으면 어색함이 많이 줄어드네요.
솔직히 이름은 왜 바꿨나 싶습니다.
그다지 직관적인 이름도 아니게 느껴져서요...
얼마전의 힌글날이 우스워지는군요.
그게 더 편하지만 정부부처 이름에 데이터를 굳이 넣을 필욘 없어보입니다.
자료라는건 예시를 든 것이고 얼마든지 다른 말을 쓸 수 있을겁니다.
굳이 필요하지 않고 데이터라는 단어가 저 부처가 하는 일을 정확히 표현하는 것도 아닐거라서 굳이? 라는 생각이 드는게 사실입니다.
데이터는 외래어로 우리말 범주이긴 하겠지만 버스처럼 대체가 불가능한가? 라고 하면 그렇지 않다는 느낌입니다.
이런 식으로 동사무소가 주민센터가 되고 그렇게 흘러가는거죠.
(여전히 동사무소라고 하는 1인)
마치 데이터가 많기만 하면 무언가 가르침을 줄것 같은 착각을 일으킬것 같네요
저는 오히려 데이터에 대한 명확한 이해 없는 머신러닝이야 말로 가장 위험한 에러를 수반한다고 생각합니다
데이터에 대한 인간의 곡해와 호도죠
데이터가 많으면 그 안에 내재된 정보가 많다. 라는 말은 동어 반복이죠
그 정보를 어떻게 해석해야 맞느냐에 대해서는 머신러닝은 답을 줄 수 없습니다
LLM도 사람이 얼마나 많이 튜닝해야 결과가 나오는데요