인공 지능의 핵심: 1. 컴퓨터 비전은 이미지에서 사물, 장면 및 활동을 인식하는 컴퓨터의 능력을 의미합니다. 2. 기계 학습은 컴퓨터 시스템이 명시적인 프로그램 지침을 따를 필요가 없다는 사실을 의미합니다. 자연어 처리 4. 로봇 5. 음성 인식. 주로 인간 음성 기술의 자동 및 정확한 전사에 중점을 둡니다.
이 문서의 운영 환경: Windows 7 시스템, Dell G3 컴퓨터.
인공지능의 핵심:
1. 컴퓨터 비전
컴퓨터 비전은 이미지에서 사물, 장면, 활동을 인식하는 컴퓨터의 능력을 말합니다. 컴퓨터 비전 기술은 일련의 이미지 처리 작업 및 기타 기술을 사용하여 이미지 분석 작업을 관리 가능한 단위로 나눕니다. 예를 들어, 일부 기술은 이미지에서 개체의 가장자리와 질감을 감지할 수 있으며, 분류 기술을 사용하여 식별된 특징이 시스템에 알려진 개체 클래스를 나타내는지 여부를 결정할 수 있습니다.
컴퓨터 비전은 다음을 포함하여 광범위한 응용 분야를 가지고 있습니다. 의료 영상 분석은 질병 예측, 진단 및 치료를 개선하는 데 사용됩니다. Facebook에서는 얼굴 인식을 사용하여 사진 속 사람을 자동으로 식별합니다. 용의자 식별 사람, 쇼핑할 때 이제 소비자는 스마트폰으로 제품 사진을 찍어 더 많은 구매 옵션을 얻을 수 있습니다.
머신 비전은 관련 분야로서 일반적으로 산업 자동화 분야의 비전 애플리케이션을 의미합니다. 이러한 애플리케이션에서 컴퓨터는 매우 제한된 공장 환경에서 생산 부품과 같은 객체를 식별하므로 제약 없는 환경에서 작동하려는 컴퓨터 비전보다 목표를 더 단순하게 만듭니다. 컴퓨터 비전은 지속적인 연구인 반면, 머신 비전은 연구 수준 주제가 아닌 시스템 엔지니어링 주제인 "문제 해결"입니다. 애플리케이션이 계속 확장됨에 따라 일부 컴퓨터 비전 스타트업은 2011년부터 벤처 캐피털에서 수억 달러를 유치했습니다.
2. 기계 학습
기계 학습은 명시적인 프로그램 지침을 따르지 않고 데이터에만 의존하지 않고 성능을 향상시킬 수 있는 컴퓨터 시스템의 능력을 말합니다. 기본적으로 기계 학습은 데이터의 패턴을 자동으로 발견하고, 발견되면 패턴을 사용하여 예측을 할 수 있습니다. 예를 들어, 기계 학습 시스템에 거래 시간, 판매자, 위치, 가격, 거래 적법 여부 등 신용 카드 거래 정보의 데이터베이스가 제공되면 시스템은 신용 카드 사기를 예측하는 데 사용할 수 있는 패턴을 학습합니다. 더 많은 거래 데이터가 처리될수록 예측이 더 정확해집니다.
머신러닝은 광범위한 응용 분야를 가지고 있으며, 엄청난 양의 데이터를 생성하는 거의 모든 활동의 성능을 향상시킬 수 있는 잠재력을 가지고 있습니다. 사기 심사 외에도 이러한 활동에는 판매 예측, 재고 관리, 석유 및 가스 탐사, 공중 보건 등이 포함됩니다. 머신러닝 기술은 컴퓨터 비전과 같은 다른 인지 기술 분야에서도 중요한 역할을 합니다. 컴퓨터 비전은 대규모 이미지의 시각적 모델을 지속적으로 훈련하고 개선하여 객체 인식 능력을 향상시킬 수 있습니다.
현재 머신러닝은 인지 기술 분야에서 가장 인기 있는 연구 분야 중 하나가 되었으며, 2011년부터 2014년까지 약 10억 달러에 달하는 벤처 캐피탈을 유치했습니다. 구글은 또한 2014년에 기계 학습 기술을 연구하는 회사인 딥마인드(Deepmind)를 인수하기 위해 4억 달러를 지출했습니다.
3. 자연어 처리
자연어 처리란 컴퓨터가 가지고 있는 인간과 유사한 텍스트 처리 능력을 말합니다. 예를 들어, 텍스트에서 의미를 추출하고 읽기 쉽고 스타일이 자연스러우며 문법적으로 올바른 텍스트의 의미를 독립적으로 해석할 수도 있습니다. 자연어 처리 시스템은 인간이 텍스트를 처리하는 방식을 이해하지 못하지만 매우 복잡하고 정교한 방식으로 텍스트를 능숙하게 처리할 수 있습니다. 예를 들어, 문서에 언급된 모든 사람과 장소를 자동으로 식별하고, 문서의 핵심 주제를 식별하고, 사람이 읽을 수 있는 계약서 더미에서 다양한 이용 약관을 추출하여 테이블을 만듭니다. 이러한 작업은 단순한 텍스트 일치와 패턴만 수행하는 기존 텍스트 처리 소프트웨어로는 수행할 수 없습니다.
자연어 처리는 컴퓨터 비전 기술과 마찬가지로 목표 달성에 도움이 되는 다양한 기술을 통합합니다. 언어 모델은 언어 표현의 확률 분포(예: 주어진 문자열이나 단어가 특정 의미론적 의미를 표현할 가능성의 최대 가능성)를 예측하기 위해 구축되었습니다. 선택한 기능은 텍스트의 특정 요소와 결합되어 텍스트를 식별함으로써 특정 유형의 텍스트를 일반 이메일의 스팸 이메일과 같은 다른 텍스트와 구별할 수 있습니다. 기계 학습에 기반한 분류 방법은 이메일이 스팸인지 여부를 결정하는 데 사용되는 필터링 기준이 됩니다.
"timeflies"와 "fruitflies"의 차이를 이해하는 데는 맥락이 매우 중요하기 때문에 특정 제품에 대한 고객 반응 및 서비스 피드백을 분석하고 민사소송에서 특정 의미를 자동으로 밝혀내는 등 자연어 처리 기술의 실제 적용 범위는 상대적으로 좁습니다. 또는 정부 조사, 기업 수익 및 스포츠 등에 대한 공식적인 에세이를 자동으로 작성합니다.
4. 로봇
머신 비전 및 자동 계획과 같은 인지 기술을 매우 작지만 고성능 센서, 액추에이터 및 영리하게 설계된 하드웨어에 통합하여 다음 세대의 로봇을 탄생시켰습니다. 인간과 함께 일할 수 있는 능력, 알려지지 않은 다양한 환경에서 다양한 작업을 유연하게 처리할 수 있는 능력. 예를 들어, 드론, 작업장에서 사람과 작업을 공유할 수 있는 '코봇' 등이 있습니다.
5. 음성 인식
음성 인식은 주로 인간의 음성 기술을 자동으로 정확하게 복사하는 것과 관련이 있습니다. 이 기술은 자연어 처리와 유사한 몇 가지 문제에 직면해야 하며, 서로 다른 악센트, 배경 소음, 동음어/동의어 구별("구매"와 "by" 소리가 동일함)을 처리하는 데 어려움이 있으며 동시에 정상적인 말하기 속도를 따라가는 속도로 작업할 수 있습니다. 음성 인식 시스템은 자연어 처리 시스템과 동일한 기술 중 일부를 사용하며, 소리와 특정 시퀀스 및 언어에서 소리가 발생할 확률을 설명하는 음향 모델과 같은 다른 기술로 보완됩니다. 음성 인식의 주요 응용 분야에는 의료 받아쓰기, 음성 쓰기, 컴퓨터 시스템 음성 제어, 전화 고객 서비스 등이 포함됩니다. 예를 들어, 도미노 피자는 최근 사용자가 음성으로 주문할 수 있는 모바일 앱을 출시했습니다.
더 많은 관련 지식을 알고 싶다면 FAQ 칼럼을 방문해주세요!
위 내용은 인공지능의 핵심은 무엇인가의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!