Apache Flink는 Apache Software Foundation에서 개발한 오픈 소스 스트림 처리 프레임워크입니다. 핵심은 Java 및 Scala로 작성된 분산 스트리밍 데이터 흐름 엔진입니다. Flink는 모든 스트리밍 데이터 프로그램을 데이터 병렬 방식으로 실행하며 Flink의 파이프라인 런타임 시스템은 일괄 처리 및 스트림 처리 프로그램을 실행할 수 있습니다. 또한 Flink의 런타임 자체도 반복 알고리즘 실행을 지원합니다.
Flink는 높은 처리량, 낮은 지연 시간의 스트리밍 데이터 엔진을 제공하고 이벤트 시간 처리 및 상태 관리를 지원합니다. Flink 애플리케이션은 기계 오류가 발생할 경우 내결함성이 있으며 정확히 한 번 의미 체계를 지원합니다. 프로그램은 Java, Scala[9], Python[9], SQL 등의 언어로 작성할 수 있으며 클러스터 또는 클라우드 환경에서 실행되는 데이터 흐름 프로그램으로 자동으로 컴파일되고 최적화됩니다.
Flink는 자체 데이터 저장 시스템을 제공하지 않지만 Amazon Kinesis, Apache Kafka, HDFS, Apache Cassandra 및 ElasticSearch와 같은 시스템에 대한 데이터 소스 및 싱크를 제공합니다.
Apache Flink의 데이터 흐름 프로그래밍 모델은 유한 및 무한 데이터 세트에 대한 이벤트별 처리를 제공합니다. 기본 수준에서 Flink 프로그램은 스트림과 변환으로 구성됩니다. "개념적으로 스트림은 데이터 스트림의 (끝이 없을 수도 있는) 레코드이며 변환은 하나 이상의 스트림을 입력으로 사용하여 하나 이상의 출력 스트림을 생성하는 작업입니다."
Apache Flink에는 두 가지 핵심 API가 포함되어 있습니다. 즉, 제한되거나 제한되지 않은 데이터 스트림을 위한 Dataflow API와 제한된 데이터 세트를 위한 Dataset API입니다. Flink는 또한 Flink의 데이터 흐름 및 데이터 세트 API에 쉽게 내장할 수 있는 관계형 스트리밍 및 일괄 처리를 위한 SQL과 유사한 표현 언어인 테이블 API를 제공합니다. Flink가 지원하는 최고 수준 언어는 SQL입니다. 이는 테이블 API와 의미상 유사하며 프로그램을 SQL 쿼리 표현식으로 나타냅니다.
더 많은 Apache 관련 지식을 알고 싶다면 Apache 사용 튜토리얼 칼럼을 방문해 보세요!
위 내용은 아파치 플링크란 무엇인가의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!