구글도 그랬나요? Bard는 훈련을 위해 ChatGPT 데이터를 사용하도록 노출되었습니다. 큰 모델은 실제로 단계별로 뒤처지고 있습니다.-일체 포함-php.cn

구글도 그랬나요? Bard는 훈련을 위해 ChatGPT 데이터를 사용하도록 노출되었습니다. 큰 모델은 실제로 단계별로 뒤처지고 있습니다.

PHPz

풀어 주다： 2023-04-04 12:30:02

앞으로

1661명이 탐색했습니다.

The Information에 따르면, 전 Google 인공지능 연구원인 Jacob Devlin은 최근 OpenAI에 합류하기 위해 회사를 떠났지만, 그 전에 Google의 모회사인 Alphabet의 CEO인 Sundar Pichai에게 Google의 채팅에 대해 경고했다고 밝혔습니다. 간접적인 방법으로 ChatGPT를 사용하세요.

구글도 그랬나요? Bard는 훈련을 위해 ChatGPT 데이터를 사용하도록 노출되었습니다. 큰 모델은 실제로 단계별로 뒤처지고 있습니다.

바이두원신이옌이 '껍데기' 사건으로 조사를 받았던 것을 아직도 기억하시나요? 최근 외신들은 구글도 그런 일을 한 것 같다는 소식을 전했습니다.

더인포메이션에 따르면, 전 구글 인공지능 연구원 제이콥 데블린은 최근 회사를 떠나 OpenAI에 합류했지만, 그 전에 구글의 모회사인 알파벳의 CEO 순다르 피차이에게 구글의 챗봇인 바드(Bard)가 데이터를 가져오고 있다고 경고했다고 밝혔습니다. ChatGPT에서 간접적인 방법으로.

Devlin의 설명에 따르면 Bard의 개발팀은 ShareGPT라는 웹사이트를 방문했는데, 이 웹사이트는 ChatGPT를 통해 사용자가 얻은 수많은 채팅 콘텐츠를 공유하고 게시했습니다. 이는 Bard가 ChatGPT의 기성 데이터를 사용하여 자체적으로 "장착"했다는 의미이며 이는 ChatGPT의 초기 결과를 훔치는 것과 같습니다.

구글도 그랬나요? Bard는 훈련을 위해 ChatGPT 데이터를 사용하도록 노출되었습니다. 큰 모델은 실제로 단계별로 뒤처지고 있습니다.

이에 대해 Google 대변인 Chris Pappas는 신속하게 언론에 성명을 발표하여 "Bard는 ShareGPT 또는 ChatGPT의 어떤 데이터에 대해서도 교육을 받지 않았습니다.")"

언론의 요청에 따라 Google Bard가 이전에 ChatGPT 데이터를 사용한 적이 있는지 여부에 관계없이 Pappas는 그가 말할 수 있는 것은 위의 진술뿐이라고 주장하면서 답변을 거부했습니다.

이 사건은 최근 Baidu Wenxin Yiyan이 직면한 유사한 의심을 사람들에게 상기시키지 않을 수 없습니다.

3월 말, 일부 네티즌들은 바이두원신(Baidu Wenxin)의 이옌페인팅(Yiyan Painting)에 의문을 제기하는 글을 올렸는데, 이는 본질적으로 “중국어 문장을 영어 단어로 기계 번역하고, 최근 해외에 오픈소스로 공개된 인공지능 안정 확산(Stable Diffusion)을 이용해 그림을 생성한 후 다시 돌아온다”는 뜻이다.

당시 네티즌들이 제시한 예로는 Wen Xinyiyan에게 지시를 입력하고 "쥐와 버스"를 그려달라고 요청하는 것이 포함됩니다. Wenxinyiyan이 만든 그림은 "쥐와 버스"였기 때문입니다. 마우스”와 “버스”는 영어로 “마우스”와 “버스”입니다.

바이두도 긴급 대응을 했는데요. 3월 23일, Baidu는 Wenxin Yiyan이 완전히 Baidu에서 개발한 대규모 언어 모델이며 Wenxin 그래프 기능은 Wenxin 크로스 모달 대형 모델 ERNIE-ViLG에서 비롯되었다는 성명을 발표했습니다. 대규모 모델 훈련에서 Baidu는 업계 관행에 부합하는 글로벌 인터넷 공개 데이터를 사용합니다. 동시에 그는 Wen Xinyiyan이 사용 과정에서 끊임없이 배우고 성장하고 있으며 모든 사람이 자체 개발한 기술과 제품에 대해 어느 정도 자신감을 가지기를 바란다고 말했습니다.

구글도 그랬나요? Bard는 훈련을 위해 ChatGPT 데이터를 사용하도록 노출되었습니다. 큰 모델은 실제로 단계별로 뒤처지고 있습니다.

그 후 Baidu는 유사한 문제를 수정했고, 사용자들은 관련 문제가 더 이상 존재하지 않는다는 것을 빠르게 발견했으며, 이는 사용자 피드백을 바탕으로 유사한 상황이 수정되고 있음을 나타냅니다.

Baidu Wen Xinyiyan의 질문에 대해 업계 전문가들은 온라인 공공 데이터의 사용이 기본적인 산업 운영이라고 말했습니다. 이 업계에는 AI 애플리케이션용 교육 데이터를 전문으로 하는 수많은 중간 서비스 제공업체가 있습니다. 공개 데이터 주석을 기반으로 교육하는 AI 데이터 세트는 실제로 여러 AI 애플리케이션에서 동시에 사용됩니다.

그러나 업계의 기본 운영은 소비자 수준에서 동일한 이해와 인정을 받지 못할 수 있습니다. 이번에 Google Bard가 ChatGPT 데이터를 교육에 사용하는 것이 노출되어 해외에서도 많은 네티즌이 Google을 도용했다고 비난했습니다. OpenAI의 결과.

웹사이트 정보를 비롯한 인터넷상의 공공데이터는 기술적 수단을 통해 쉽게 수집되는데, 검색엔진인 구글의 경우에는 더욱 용이합니다. 게다가 최근 퇴사한 구글 직원들에게서 이런 폭로가 나오며 자연스럽게 신뢰도도 크게 높아졌다.

그러나 일부 네티즌들은 데블린이 구글 AI 팀을 떠난 후 경쟁사 OpenAI에 합류했다는 점을 지적했습니다. 그의 폭로는 필연적으로 상업적인 이익과 관련이 있으며 진위 여부는 추가 확인이 필요합니다.

그러나 Geek.com의 관점에서는 이러한 사건의 진위 여부에 관계없이 '철칙'을 충분히 보여줍니다. 즉, 대형 AI 모델 분야는 실제로 단계별로 뒤쳐져 있으며 후발자들은 따라잡고 싶어합니다. 퍼스트 무버에게는 쉽지 않습니다.

알고리즘, 컴퓨팅 성능, 훈련 데이터 품질 등 여기에 영향을 미치는 많은 요소가 있습니다. 더 중요한 것은 최초의 대규모 AI 모델이 성공을 향한 길을 찾은 후에도 계속 훈련하고 진화하며, 추격자를 기다리지 않고 멈추지 않을 것이라는 점입니다.

이 때문에 OpenAI의 GPT는 GPT-3에서 GPT-4 시대로 빠르게 업그레이드되었으며, 이로 인해 머스크를 비롯한 여러 유명 인사가 공동으로 대기업에 대형 모델 개발 중단을 촉구하는 공개 서한을 발행하게 되었습니다. , 인간을 위협하지 않기 위해.

구글도 그랬나요? Bard는 훈련을 위해 ChatGPT 데이터를 사용하도록 노출되었습니다. 큰 모델은 실제로 단계별로 뒤처지고 있습니다.

Robin Li도 이전 언론과의 인터뷰에서 일부 분야에서는 더 나은 성능을 발휘하지만 전반적으로 Baidu Wenxinyiyan과 OpenAI ChatGPT 수준 사이에는 여전히 1~2개월의 격차가 있다고 말했습니다. 그는 또한 ChatGPT가 초기 단계에 출시되었을 때 Wen Xinyiyan보다 외부 피드백이 더 나빴다고 지적했습니다.

구글 바드(Google Bard)에게도 안 좋은 소식이 있습니다. 구글의 브레인 인공지능팀이 알파벳 계열의 또 다른 인공지능 회사인 딥마인드(DeepMind)와 협력하여 코드명 제미니(Gemini)라는 새로운 프로젝트를 공동으로 진행한다는 소문이 있습니다. OpenAI의 GPT와 경쟁할 수 있는 제품. 이는 구글이 바드에 자신이 없으며, 좀 더 발전된 AI 대형 모델을 개발해 더욱 발전된 AI 채팅 로봇을 만들고자 한다는 의미로 보인다.

위 내용은 구글도 그랬나요? Bard는 훈련을 위해 ChatGPT 데이터를 사용하도록 노출되었습니다. 큰 모델은 실제로 단계별로 뒤처지고 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!