매일 논문을 검색하는 친구들에게 유용한 검색 도구가 있다면 너무 기뻐하지 마세요. 효율성이 크게 향상될 것입니다.
하지만 실제 결과는 검색 도구가 강력하지 않거나, 입력한 키워드가 작동하지 않는다는 것입니다. 어쨌든 마음속에 찾고 싶은 논문과 검색 결과는 아무 상관이 없다고 할 수 있습니다. 그것은 단순히 서로 다른 장소입니다.
아래에서 소개할 웹사이트는 논문 검색 시 발생하는 문제를 해결하는 데 도움이 될 수 있습니다. arXiv Xplorer라는 웹사이트는 arXiv에서 논문의 의미 검색에 특별히 사용되는 웹사이트입니다. 프로젝트 작성자에 따르면 사이트의 내부 알고리즘은 OpenAI의 최신 임베딩 모델을 사용하여 사용자가 가장 관련성이 높은 논문을 찾을 수 있는 검색어를 생성합니다.
arXiv Xplorer 주소: https://arxivxplorer.com/
프로젝트 작성자는 다음과 같이 말했습니다. OpenAI의 새로운 임베딩 API에 깊은 인상을 받았기 때문에 임베딩을 살펴보고 싶었습니다. 실제로 사용되는 방법. 그래서 그는 프로젝트를 구축하는 데 며칠을 보냈고 지금까지는 정말 잘 작동하고 있습니다. 이 외에도 그는 ChatGPT에서 UI의 80%를 작성하고 솔방울을 사용하여 벡터 데이터베이스를 저장했으며 googlecloud 기능을 사용하여 쿼리를 삽입하고 조회를 수행했습니다.
임베디드 모델에 대해 더 자세히 알고 싶으시면 홈페이지에 방문하시면 보실 수 있습니다.
임베딩 모델: https://openai.com/blog/new-and-improved-embedding-model/
arXiv Xplorer를 사용하면 설명이 다음과 같더라도 필요한 문서를 찾을 수 있습니다. 매우 엔진은 "흥미로운 ML 논문"과 같은 정보 내용 없이 설명만 입력하는 경우에도 모호한 내용을 처리하는 데 도움을 줄 수 있습니다. 아래와 같이 여러 개의 키워드를 입력한 후 웹사이트에 표시되는 쿼리 결과입니다.
이 과정에서 Google이나 arXiv 자체 검색과 같은 기존 검색 도구에 비해 이전에 보지 못했던 흥미로운 논문을 발견할 수도 있습니다. 그에 비해 arXiv Xplorer가 더 효과적인 것 같습니다. .
arxiv URL을 붙여넣어 유사 논문을 직접 검색할 수도 있습니다. 예를 들어 아래 그림에 입력한 내용은 "A Generalist Agent" 논문의 주소이며, 검색 결과에는 유사성이 표시됩니다. Generalist Agent의 비율은 100%이며, 다른 검색 결과는 점수에 따라 순서대로 확장됩니다.
또한 위의 빨간색 상자에 있는 작은 삼각형을 클릭할 수도 있습니다. 그러면 인터페이스가 아래와 같이 되어 논문 참가자와 초록이 표시되며 아래에는 "비슷한 항목 더 보기"라는 두 가지 기능이 있습니다. 더 많은 유사한 논문이 표시됩니다. "보기"는 arXiv의 논문 홈페이지로 연결됩니다.
이 모든 기능을 갖춘 웹 사이트를 본 네티즌들은 호기심을 억제하지 못하고 "OpenAI의 임베딩 기술을 사용했는데 이 기술은 유료인데 왜 얼마를 지불하셨나요?"라고 물었습니다. 이것?" 프로젝트 작성자는 "CS 카테고리에 모든 논문(약 50만개 기사)을 삽입하는 데 40달러가 든다"고 말했습니다.
일부 네티즌들은 다음과 같은 기술에 대한 일련의 질문도 제기했습니다. : "이 웹사이트는 삽입되어 있습니다. arXiv 제목을 모두 삽입하셨나요?" 프로젝트 작성자는 "그는 모든 논문의 제목과 초록을 삽입했습니다. 처음에는 코사인 유사성과 정렬을 수동으로 수행했지만 솔방울 덕분에 매우 쉬워졌습니다!"라고 말했습니다.
또한 일부 네티즌들은 "이 도구의 검색 기능이 매우 좋습니다! 출시 날짜별로 보고 정렬할 수 있으면 좋겠다"고 제안했습니다. 이에 대해 프로젝트 작성자는 앞으로도 계속할 것이라고 말했습니다. 앞으로는 최적화하고 더욱 완벽한 기능을 달성하기 위해 노력하겠습니다.
위 내용은 ChatGPT 덕분에 한 번의 클릭으로 arXiv에서 가장 관련성이 높은 논문을 검색할 수 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!