재미있는 글이었다.
뉴코아 자전거 분수 일요일 사랑 이명박
위 단어들에 대한 너의 검색결과들도 아주 흥미로웠는데, 결론은 부쉬와 이명박을 비난하는 내용이었다는 공통점이 있었다.
하지만 이 결과는, 아주 엉뚱하거나 바보스러운 결과라고 생각지는 않는다. (물론 너도 그걸 이해하고 있다고 생각한다)
비록 까페에 지나가는 남녀가 한 대화의 실제 내용과는 전혀 다른 엉뚱한 결과라고 볼 수있지만,
그 이면은 결국 네이버와 구글의 단순무식한 인덱싱 기능으로도, 현재 사회적 관심거리나 이슈에 대하여 자연스러운 검색 결과가 나타났다는 것이다.
이것은 충분한 성능을 발휘한 검색결과(사회적인 의미에서 많은 사람들의 여론이 반영된)라는 것이다.
그리고 네이버에서는 검색 인덱싱을 "아줌마 부대"가 수작업으로 한다는 소문이 파다했지만,
실은, 네이버에서는 검색결과를 나름의 카테고리로 나누는 작업이나 컨텐츠별 분류 등의 목적으로만 "알바(실제론 정직원이겠지)"를 고용한 것일 뿐, 위의 결과를 만들어 낸 것은 그 알바들이 아니라 앞서 Chatting Robot 이야기1에서 내가 설명한 [단순무식]한 인덱싱 기능을 통해서라고 난 생각한다. 즉, 구글이나 네이버도 아주 바보는 아니란 뜻이야.
사람들이 실제로 이야기하는 내용과 검색엔진의 검색결과는 동떨어져 있는 것이 현실입니다
라는 너의 의견은 반은 맞지만, 반은 틀리다는 의미야.
즉 사회적 의미로는 Reasonable한 답이고, 개인적 의미로는 엉뚱한 답이라는 것이지.
네가 말한, 분류에 대한 카테고리는 우리가 단어를 인지하는 하나의 방법이라고 생각한다.
한 단어도 여러 카테고리로 분류할 수 있다는 것.
이것은 분명히 단어를 정의하는 방법( 지식을 정의하는 방법 ) 중의 하나일 수 있다.
하지만 단어가 어떤 카테고리에 들어있다라는 정보들만으로, 그 단어를 AI가 "인지"했다고는 말하기 힘들 거야.
분류는 분류일 뿐이다. (물론 분류화를 이용한 지식 정의로도 굉장히 강력하고 상상을 뛰어넘는 혁신적 일들을 해낼 수 있다고 생각한다: 이 분류화 분야로만 AI를 활용해도 굉장한 신종 아이템이나 Blue Ocean을 만들어 낼 수 있다고 생각한다. 엄청나게 연구해보고 싶은 분야다)
또한 이 분류화 기법만 적당히 활용해도 상당히 진화된 단어 연관성을 만들 수 있다고 생각한다.
하지만, 좀 더 존재론적으로 깊이 들어갈 필요가 있다고 생각해.
비트켄슈타인에 대하여 내가 깊이 알지는 못하지만, 그의 철학이 도움이 될 것 같다.
내 기억에 의하면, 언어와 그 본질에 대한 관계를 비트켄슈타인이 설명한 것을 생각해보면, 언어에 의해 본질이 변화될 수도 있다는 대목이 있었다.
인간은 언어를 어떻게 인식하는가?
(좀 더 자세히 표현해본다면: ) 인간의 뇌는 언어를 통해 어떻게 본질을 인식하는가?
본래 우리의 탐구주제인 단어 연관성보다 좀 더 본질적 의문으로 옮겨갔다. ( 이것은 다분히 내 의도적인 것임을 고백한다. )
인간은 단어를 어떻게 인식하는가?
이렇게 보다 본질적 의문으로 시작한다면, 우리의 주제인 "단어 연관성"에 대한 새로운 해석이 가능하지 않을까 싶다.
그에 대해선 다음 글에서 좀 더 즐거운 상상력과 함께 논의해보마.
- 나무달 씀
p.s.
패턴인식에 대한 얘기는 잠시 내버려두었는데 할 수 있는 상상과 이야기가 너무 많다, 아주 합리적이고 흥미로운 기법이다.
나중에 함께 논의하자.
인공지능 (AI)2009/02/27 01:16
댓글을 달아 주세요