sbpyun said:
자료수집이야 이미 이루어졌지요. 구글링이 답이고..요.
자료간의 연관관계 만들기.. 관계라는 것도 어느 정도 되기는 합니다. 하지만, 답의 명확함을 주기 위해서는 선택을 해야하는데 선택을 하면서도 그 관계를 놓치 않는 알고리즘이 필요합니다. 엘봇에서도 답을 모른다는 답보다는 틀린 답이라도 내어놓는 노련함을 보이잖아요. 하지만, 어떻게 관계(함수, 구조)를 만들어내는 문제는 미해결입니다.
답변이야.. 머.. 이야기할 필요까지는 없을 듯.
문제는 어떻게 관계를 설정하는가 입니다...
"구글링한 결과의 관계설정" 요것이 핵심어 이네요.
쉽지는 않습니다. 이것이 해결된다면, 검색시장도 큰변화를 볼 수 있지 않겠어요!!
네이버가 구글을 앞서서 세계로 나아가는 방법중 하나는 검색한 결과를 얼마나 빨리 잘 연관관계를 주느냐 입니다. 뭐.. 사람들이 엮는 일을 제외한구요.. 인공지능이 필요한데 기술이 없으니.. 안타깝습니다.
그래도 어느 정도 단순한 연관관계는 찾아주는 알고리즘을 사용하는 것처럼 보이던데요. 클릭수, 명성도를 스코어링 해두는 방법과 몇 개의 상수를 만들어두고 묶어주는 일을 통해서... 실제로는 필요하니깐.. 어쩔수 없지요. 또 네티즌들의 패턴을 사용해서 자연스럽게 연관관계를 추정하는 알고리즘을 만드는 것도 괜찮고요.
--------------
너의 마지막 댓글부터 AI: Chatting Robot에 대한 추가 이야기를 시작하고 싶다.
<단어에 대한 연관관계를 인지하는 법>
연관관계를 만드는 여러가지 방법이 있겠지만,
구글이나 네이버는 단순 통계적 기법을 우선적으로 사용하는 것으로 알고 있다.
예를 들어 보자...
단순무식한 단어 연관성 만드는 방법:
검색창에서 "911" 이란 단어를 치면, 무엇이 연관될까?
"World Trade Tower" 같은 게 될 거야.
인간은 상식선에서 "911"과 "World Trade Tower"의 연관성을 알고 연상(Remind)를 해낼 수 있지만, AI는 문맥을 파악하지 않는 한 그 연관성을 짓기 어렵지.
하지만 실제로 검색을 위해 타이핑하던 네티즌은 "How much victim died in World Trade Tower at 911?" 와 같이 길게 입력을 했을 가능성이 높고,
따라서 이러한 긴 문장을 구글의 서치로봇이 단어별로 통계를 낸다면, "911"이란 단어가 검색되었을 때 그와 같이 가장 많이 사용된 단어를 통계낼 수 있을 것이고, 이런 기계적 방법으로도 우리가 찾는 "911" <---> "World Trade Tower"와의 연관성을 [단순무식]하게 설정할 수 있다.
이것은 SQL을 조금만 활용하면 Indexing기법을 써서 가장 자주 사용된 연관 단어를 찾는 기법으로 구현이 가능하다.
실제로 네이버와 구글이 이런 기계적 연관성 통계를 내고 있을까?
나도 모른다. 고액 연봉의 Brain들은 다 모은다고 들었는데 이 정도도 안하고 있다면, 그들이 멍청하다고 밖에 할 수 없지 않을까? 아마도 당연히 이와 유사한 통계 분석은 하고 있지 않을까 싶다. 그런데 왜 검색 때 이런 기능이 활용되지 않는지는 나도 모르겠다. 정말로 멍청해서가 아닐까? ㅋㅋ
어쨌든, 이런 기능은 이것대로 유용하긴 하지만, 말그대로 단순무식하다.
좀 더 진화된 단어 연관성 만드는 방법 (지식을 다루는 법 ) :
이런 단순 통계적 연관성이 아닌, 실제로 단어 또는 정보의 조합은 지식(Knowledge)라는 추상적 용어를 써볼 수 있을까?
이것을 우리가 다룰 수 있다면 검색엔진을 획기적으로 진화시킬 수 있으며, 단순히 그건 검색엔진에서 끝나지 않을거야.
그 방법에 대한 건 이야기 3에서 다루도록 하자. 아마 방대하면서도 즐거운 상상력이 동원되는 지적 모험이 될 것 같다.
자료수집이야 이미 이루어졌지요. 구글링이 답이고..요.
자료간의 연관관계 만들기.. 관계라는 것도 어느 정도 되기는 합니다. 하지만, 답의 명확함을 주기 위해서는 선택을 해야하는데 선택을 하면서도 그 관계를 놓치 않는 알고리즘이 필요합니다. 엘봇에서도 답을 모른다는 답보다는 틀린 답이라도 내어놓는 노련함을 보이잖아요. 하지만, 어떻게 관계(함수, 구조)를 만들어내는 문제는 미해결입니다.
답변이야.. 머.. 이야기할 필요까지는 없을 듯.
문제는 어떻게 관계를 설정하는가 입니다...
"구글링한 결과의 관계설정" 요것이 핵심어 이네요.
쉽지는 않습니다. 이것이 해결된다면, 검색시장도 큰변화를 볼 수 있지 않겠어요!!
네이버가 구글을 앞서서 세계로 나아가는 방법중 하나는 검색한 결과를 얼마나 빨리 잘 연관관계를 주느냐 입니다. 뭐.. 사람들이 엮는 일을 제외한구요.. 인공지능이 필요한데 기술이 없으니.. 안타깝습니다.
그래도 어느 정도 단순한 연관관계는 찾아주는 알고리즘을 사용하는 것처럼 보이던데요. 클릭수, 명성도를 스코어링 해두는 방법과 몇 개의 상수를 만들어두고 묶어주는 일을 통해서... 실제로는 필요하니깐.. 어쩔수 없지요. 또 네티즌들의 패턴을 사용해서 자연스럽게 연관관계를 추정하는 알고리즘을 만드는 것도 괜찮고요.
--------------
너의 마지막 댓글부터 AI: Chatting Robot에 대한 추가 이야기를 시작하고 싶다.
<단어에 대한 연관관계를 인지하는 법>
연관관계를 만드는 여러가지 방법이 있겠지만,
구글이나 네이버는 단순 통계적 기법을 우선적으로 사용하는 것으로 알고 있다.
예를 들어 보자...
단순무식한 단어 연관성 만드는 방법:
검색창에서 "911" 이란 단어를 치면, 무엇이 연관될까?
"World Trade Tower" 같은 게 될 거야.
인간은 상식선에서 "911"과 "World Trade Tower"의 연관성을 알고 연상(Remind)를 해낼 수 있지만, AI는 문맥을 파악하지 않는 한 그 연관성을 짓기 어렵지.
하지만 실제로 검색을 위해 타이핑하던 네티즌은 "How much victim died in World Trade Tower at 911?" 와 같이 길게 입력을 했을 가능성이 높고,
따라서 이러한 긴 문장을 구글의 서치로봇이 단어별로 통계를 낸다면, "911"이란 단어가 검색되었을 때 그와 같이 가장 많이 사용된 단어를 통계낼 수 있을 것이고, 이런 기계적 방법으로도 우리가 찾는 "911" <---> "World Trade Tower"와의 연관성을 [단순무식]하게 설정할 수 있다.
이것은 SQL을 조금만 활용하면 Indexing기법을 써서 가장 자주 사용된 연관 단어를 찾는 기법으로 구현이 가능하다.
실제로 네이버와 구글이 이런 기계적 연관성 통계를 내고 있을까?
나도 모른다. 고액 연봉의 Brain들은 다 모은다고 들었는데 이 정도도 안하고 있다면, 그들이 멍청하다고 밖에 할 수 없지 않을까? 아마도 당연히 이와 유사한 통계 분석은 하고 있지 않을까 싶다. 그런데 왜 검색 때 이런 기능이 활용되지 않는지는 나도 모르겠다. 정말로 멍청해서가 아닐까? ㅋㅋ
어쨌든, 이런 기능은 이것대로 유용하긴 하지만, 말그대로 단순무식하다.
좀 더 진화된 단어 연관성 만드는 방법 (지식을 다루는 법 ) :
이런 단순 통계적 연관성이 아닌, 실제로 단어 또는 정보의 조합은 지식(Knowledge)라는 추상적 용어를 써볼 수 있을까?
이것을 우리가 다룰 수 있다면 검색엔진을 획기적으로 진화시킬 수 있으며, 단순히 그건 검색엔진에서 끝나지 않을거야.
그 방법에 대한 건 이야기 3에서 다루도록 하자. 아마 방대하면서도 즐거운 상상력이 동원되는 지적 모험이 될 것 같다.
댓글을 달아 주세요