인공지능 AI 챗봇 ChatGPT 가 검색시장에 미칠 영향 - 마이크로소프트가 투자한다

인공 지능 AI 채팅봇 ChatGPT가 검색 시장에 미치는 영향 – Microsoft가 투자

새해 벽두에서 혜성처럼 등장한 ChatGPT가 시장을 흔들고 있습니다. 적어도 주식 시장을 보는 사람이라면 놓칠 수없는 트렌드이므로 인공 지능 AI 채팅 봇 채팅 GPT에 대해 살펴 보겠습니다.

채팅 GPT

GPT는 Generative Pre-trained Transformer라는 길고 긴 이름의 약어로 딥 러닝을 이용하여 기존 인간이 작성한 문서를 학습하고 이를 바탕으로 인간다운 문장을 만들어내는 자기회귀 언어 모델입니다.

말은 조금 어렵지만 언어 공부를 즐기는 신생아라고 말하면 됩니다. 자신보다 먼저 사람들이 만든 책, 기사, 뉴스, 잡지, 인터넷 포스트, 컴퓨터 코드 등을 읽고, 어떤 테마에는 어떤 문장이 사용되는지를 학습하고, 그것을 바탕으로 사람들의 질문에 한 문장씩 완성해 나가면서 자기 회귀적이고 문장을 만들어 내는 인공 지능 알고리즘이라고 생각합니다.

학습할 대상이 매우 다양하기 때문에 답변할 수 있는 질문의 카테고리도 기존의 채팅봇과는 차원이 다릅니다. 특정 정보에 대한 정보는 사람보다 훨씬 빨리 대답 할 수 있으며 정확성도 신경 쓰지 않습니다. 이것을 사용해 보면 엄청난 말이 나올 정도로 끝나는 성능을 보여줍니다.

원하는 주제 제안을 요청하는 요청에도 매우 높은 성능을 보여줍니다. 예를 들어, 100건의 건강에 관한 토론을 가르치면 말 그대로 건강에 관한 토론의 주제를 100건 꺼냅니다. 그것도 매우 빠릅니다. 퀄리티의 면에서도 사람이 머리를 잡고, 만들어낸 100개의 테마보다 훨씬 뛰어납니다.

프로그래밍 코드를 대신하여 조립할 수도 있습니다. 이미 인터넷에는 허브 등에 저장된 수천만 줄의 코드가 있습니다. 이 코드를 보고 학습한 채팅 GPT가 원하는 기능을 말하면 이에 맞는 코드 조각을 표시하는 방식으로 작동합니다. 실제로 코드를 대신 짜내기보다는 좋아하는 코드를 깃털로 “매우 빨리”찾아준다는 말이 더 맞는 말입니다만.

이 기술의 가장 큰 장점은 무엇보다도 맥락을 기억한다는 것입니다. 기존의 채팅봇은 「병×같다」라는 소리가, 절에 나올 정도로 바보같았습니다. 앞서 말한 정보를 배우지 못하고 종종 다른 이야기를 했기 때문입니다. 은행 등의 사이트에서 이용하고 있는 채팅봇 서비스는 말만 인공지능 채팅봇으로, 사실상 질문과 답변을 1:1로 매칭하는 초기 모델에 불과합니다.

그러나 ChatGPT의 경우 이전에 나눈 대화를 기억합니다. 그러니까 「건강 토론 테마 100개 뽑아 줘」→「그 중에서 10개의 자료를 찾아」→「찾은 자료를 CSV 형식으로 보존해 정리해 줘」등의 문맥에 맞는 대화가 가능 됩니다. 그리고 한 번 이야기를 시작한 채팅은 문맥이 계속 기억되어 있기 때문에 새로운 질문이 있으면 이전 대화에 다시 질문 할 수 있습니다.

따라서 채팅 GTP는 매우 강력한 인공 지능 AI 채팅 봇입니다. 활용도는 무관심합니다. 이를 조사한 초거대 IT 기업인 마이크로소프트가 투자에 나선 적도 있었습니다. 사실, 인공 지능 ChatGPT가 사용 설정된 경우 가장 위협적인 영역은 검색 및 광고입니다. 이 분야에서는 구글에 크게 밀리고 있는 마이크로소프트가 상황의 역전을 위해 최초로 기술의 선취에 나선 것은 아닐까 생각합니다.

우리가 무언가를 인터넷에서 검색하는 것은 궁금해하는 것에 대한 정보를 얻기 위해서입니다. 이러한 정보는 인터넷에 다양한 형식으로 배포되며 검색엔진은 이러한 정보 중 가장 적절한 정보를 게시하는 데 도움이 됩니다. 그 중에서 광고를 보여주고 매출을 창출할 수도 있습니다.

채팅 GPT가 수행하는 역할도 아마 비슷합니다. 아니요, 정확히 동일하다고 할 수 있습니다. 걱정되는 것을 네이버에게 묻는 것이 아니라 채팅 GPT에 묻는다면 어떻게 될까요? 네이버가 나타내는 인터넷상의 정보와 GPT가 쓰는 대답이 서로 같다면 굳이 네이버를 써야 할까요? 이것은 Google이 가장 신경 쓰이는 점입니다. 정보 검색을 대치하는 채팅 GPT의 등장이 최대의 위협이라고 보고 있습니다.

그렇다면 과연 채팅 GPT에는 한계가 없습니까?

ChatGPT 제한

인공지능 분야에서 자동화된 텍스트를 작성하려는 시도는 꾸준히 이루어졌습니다. 그러나 이 기술은 매우 큰 모델을 요구했습니다. 컨텍스트를 이해하고 문장을 만들려면 매개 변수를 지수적으로 늘려야합니다.

많은 매개변수는 정교한 텍스트를 생성할 수 있었지만, 그에 비례하여 엄청난 비용을 요구했습니다. 인공지능을 훈련하려면 돈이 필요했고, 훈련된 인공지능을 사용할 때도 돈이 필요했습니다.

OpenAI가 어떻게이 문제를 해결했는지 모르겠습니다. 아직 해결되지 않았을 수도 있습니다. 투자된 돈으로 이를 해결하는 서버를 증설할 수도 있고, 국내 서비스의 루턴처럼 언젠가 유료로 서비스를 전환할 수도 있습니다. 운영에는 돈이 들기 때문에 어쩔 수 없는 부분이군요.

돈 문제를 겪더라도 2023년 현재 채팅 GPT가 제시하는 한계는 분명합니다. 기술 발전으로 조만간 해결되는 한계도 있지만, 지금의 상황에서 알아야 할 부분을 정리해 봅시다.

최신 정보 부족

모든 인공 지능은 과거의 데이터를 학습하고 이를 바탕으로 답을 내립니다. 많은 사람들이 인공 지능이 스스로 생각하고 어떤 대답을 내릴 것이라고 생각하는 경우가 많습니다.

인공지능이 그리는 회화 서비스인 달리 서비스가 만들어내는 이미지를 보고, 「와우! 대단하다」를 외치고 있습니다. 그러나 인공 지능은 창작 의지를 가지고 그림을 그리지 않습니다. 앞의 그림과 그 그림의 설명을 배우고 나면 입력한 키워드를 분석하여 가장 비슷한 그림을 합성하고 조작하여 보여줍니다.

‘뉴욕 타임스 스퀘어에서 스케이트보드를 들고 있는 곰을 그려’ 결과

텍스트도 마찬가지입니다. 채팅 GPT가 “문장 대신 쓴다”라고 표현하지만, 정확하게는 “기존 학습한 데이터에 기초하여 문장을 확률 기반으로 결합한다”. 라고 표현하는 것이 맞습니다. Google의 알파고가 가장 승리할 확률이 높다고 판단되는 수를 연속해서 두는 것만으로 실제 바둑을 두는 것이 아니라는 것과 같습니다. (이 부분에 대해서는 논의가 많습니다. 실제 바둑을 두는 것은 무엇입니까?

앞서 언급했듯이 이러한 인공 지능 모델을 한 번 훈련하는 데는 엄청난 비용이 듭니다. 공개되지는 않지만, 지금 규모로 볼 때 훈련시키는데 50억원의 비용이 들지 않을까 하는 추측도 있습니다.

따라서 ChatGPT는 최신 데이터를 기반으로 학습할 수 없었습니다. 현재까지 학습한 데이터는 거의 2021년까지입니다. 따라서 채팅 GPT에 최신 정보를 요청하면 이상한 대답이 나옵니다. 다음은 러시아와 우크라이나의 전쟁에 대해 10문장에서 가르쳐달라고 묻는 결과입니다만, 2014년의 크리미아 반도 전쟁에 대한 이야기를 내는 화면입니다. 지금 진행중인 전쟁에 대한 정보를 배울 수 없었기 때문에 나오는 결과라고 할 수 있습니다.

이러한 종류의 한계는 학습하는 기쿨을 짧게 취하면서 최신 정보를 지속적으로 습득하면 해결되는 문제입니다. 돈이 가장 큰 장애물입니다. 데이터 수집, 학습 및 검증에는 돈이 듭니다. OpenAI가 상장을 준비하는 이유는 바로 돈이 든다는 것입니다.

누락된 언어 정보

현재 OpenAI가 기존 언어 생성 모델의 한계를 웃도는 것은 42개 정도라고 합니다. 한국어도 당연히 포함되어 있습니다. 생성하는 속도는 영어와 비교해서는 안되지만 어쨌든 주목해야 할 기능입니다. 다른 언어도 동작하지만, 기존 모델보다 능력이 떨어지는 경우가 많아, 이것도 향후 개선해 나가야 할 것으로 생각됩니다.

암시적 문제 – 시각 정보, 정보 부족

암묵은 “대화하는 상호간에 알고 있다고 생각하고 생략하는 정보”를 말합니다. 학습과 경험을 통해 개인에게는 체계화되어 있지만, 표에는 나타나지 않는 지식이나 정보를 말합니다. 말로 표현되지 않고, 몸 안에 체화되어 있기 때문에, 타인에게 전하기 어렵다는 특징이 있습니다. 일종의 노하우라고 할 수 있습니다.

채팅 GPT는 문장으로 세계를 배웁니다. 암시적 문장에서는 작성되지 않은 특징이 있기 때문에 ChatGPT는 사람들의 경험을 배우지 않습니다. 사람들은 암시적인 정보를 너무 당연히 책에 포함하지 않는 경우가 많습니다. 그러므로 경험에 대한 질문이 들어오면 이상한 대답을 내릴 수 있는 단점이 있을 것입니다.

이것을 가리키고, 집에서 점자본을 이용해 방대한 정보를 습득한 맹목에 비유할 수도 있습니다. (장애인에 대한 은유는 절대는 아닙니다.) 정보를 많이 흡수했지만, 경험이라는 면에서 부족할 수밖에 없다는 것입니다.

또 다른 문제는 시각적 정보를 습득하지 않는다는 것입니다. 우리는 그로만의 세계를 배우지 않고 사진, 영상, 그림을 보아도 많은 것을 배웁니다. 그로만 세계를 배우는 ChatGPT가 나타내는 한계의 원인이기도 합니다. 물론, 이것도 기술의 발전으로 이미지, 비디오 등의 시각적인 정보를 함께 습득하면 개선할 수 있는 문제입니다. 이미 이미지나 동영상을 보고 정보를 배우는 모델도 충분히 개발되고 있는 상태이기 때문입니다.

통계 예측 모델 – 생각하지 마십시오.

GPT3 모델은 엄청난 텍스트를 배우고 어떤 단어 뒤에 어떤 단어가 나올 가능성이 높은지 예측합니다. 이렇게하면 단어를 만들고 항상 다음 단어를 예측하는 간단한 무지 방식으로 학습합니다. (이전 단어를 보고 다음 단어를 끌어내는 자기 회귀 모델 방식)

이 방법은 끊임없는 논쟁을 일으킨다. ChatGPT가 과연 언어를 이해한 것이 맞습니까? 하는 논의입니다. 매우 똑똑한 것처럼 보이지만 실제로는 다음 단어를 통계적으로 예측하고 보여주는 것만으로 이것이 상황에 맞는지 정말 이해한다는 말이 아니라는 비판이 있습니다. 뭔가 말하는 것처럼 보이는 것만으로 실제로는 단어 목록뿐이라는 것입니다.

이것은 인공 지능에 대한 기본적인 질문입니다. 인간이 뭔가를 생각하고 말하는 것도 사실은 이전에 경험한 것에 대해 단어를 조합하여 나열하는 방법으로 만들어져 있기 때문입니다. 우리가 특정 사실을 이해한다고 말하는 것은 ChatGPT가 수행하는 것과 기본적으로 어떤 차이가 발생합니까?

사실 인공지능을 공부해 보면 인간이 하는 생각이나 말도 아마 이와 비슷할지도 모른다고 생각하는 경우가 많습니다. 그도 그것이 인공지능의 학습은 인간의 뇌의 뉴런을 본래 만든 기술이 적용되기 때문입니다. 인간을 보고 만든 기술이 인공지능인데, 인간이 그 인공지능 기술을 보고 아마도 저도 인공지능과 같은 것이 아닐까 생각하는 형국입니다.

이 문제는 영원히 대답이 나올 수밖에 없습니다. 양자의 차이는 점차 감소하고, 최종적으로 인간이 ‘생각한다’는 것과 인공지능이 ‘예측’한다는 것이 같아지는 특이점이 올 수밖에 없기 때문입니다.

지금까지 Microsoft가 투자한 OpenAI의 ChatGPT에 대해 배웠습니다. 관련 주니 무려 시끄러운 사람이 많습니다만, 지금과 같은 상황이면 후속 모델은 싹트고 고생할 수밖에 없습니다. 그만큼 강력한 모델이기도 하고, 돈이 많이 들어가기 때문입니다.

마소 같은 큰 투자자를 잡지 않으면 이러한 모델은 소형 데이터 세트를 기반으로 학습하는 것만으로 결국 학습 능력의 부족으로 말라버릴 수밖에 없습니다. 관계자라면 오히려 Microsoft에 투자하는 것이 옳을 것입니다.

끝.

Source link

Post Views: 0

생각보다 어렵다는 공무원 업무

초딩때 이해안된거 원탑 ㄹㅇ

마블에 나온 한국의 국밥

디시에 인증한 국가권력급 찐따

9급이고 ㅈ소고 밥벌이만 해도 대단한 이유

인공지능 AI 챗봇 ChatGPT 가 검색시장에 미칠 영향 – 마이크로소프트가 투자한다

카테고리

뉴스레터를 구독하세요