빅데이터 AI 분야의 프라이버시 컴퓨팅 적용 사례-일체 포함-php.cn

01 프라이버시 컴퓨팅의 배경과 현황

1. 프라이버시 컴퓨팅의 배경

프라이버시 컴퓨팅은 이제 필수가 되었습니다. 한편, 개인정보보호 및 정보보안에 대한 개인 이용자의 요구가 더욱 강해졌습니다. 한편, 유럽연합의 GDPR, 미국의 CCPA, 국내 개인정보보호법 등 개인정보 보호 및 보안 관련 법률과 규정이 많이 발표되고 있으며, 점차 느슨한 규정과 정책이 엄격해지고 있습니다. , 주로 권리와 이익, 이행 범위 및 실행 강도 등에 반영됩니다. GDPR을 예로 들면, 2018년 발효된 이후 1,000건이 넘는 사례가 발생해 총 벌금이 110억이 넘고, 단일 벌금 최고액도 50억을 넘습니다(아마존).

빅데이터 AI 분야의 프라이버시 컴퓨팅 적용 사례

2. 프라이버시 컴퓨팅 현황

이러한 맥락에서 데이터 보안은 선택에서 필수로 변경되었습니다. 이로 인해 수많은 기업, 투자, 스타트업 및 실무자가 보안 및 개인 정보 보호 기술 생태계에 투자하게 되었으며, 학계에서는 업계의 요구에 부응하여 많은 미래 지향적인 탐색을 수행해 왔습니다. 이러한 요소는 최근 몇 년 동안 보안 및 개인 정보 보호 기술과 생태계의 활발한 발전에 기여했으며, 그 중 차등 개인 정보 보호, 신뢰할 수 있는 실행 환경, 동형 암호화, 안전한 다자간 계산 및 연합 학습과 같은 기술이 모두 큰 발전을 이루었습니다. Gartner는 또한 이 분야의 발전에 대해 낙관하고 있으며, 앞으로 수백억, 심지어는 수천억 규모의 시장이 될 것이라고 믿습니다.

빅데이터 AI 분야의 프라이버시 컴퓨팅 적용 사례

02 빅데이터 AI+프라이버시 컴퓨팅

1. 빅데이터 AI 배경

빅데이터 AI 배경으로, from 거시적 관점 업계의 보시다시피 빅데이터 프레임워크와 기술이 대규모로 상용화, 대중화되었습니다. 우리는 빅데이터 기술을 항상 사용하고 있을지 모르지만, 수천, 심지어 수만 개의 노드와 대규모 데이터로 구성된 서버 클러스터에서 프로그램과 모델 훈련이 실행되고 있다는 느낌을 받지 못합니다. 최근 몇 년 동안 이 분야의 개발 방향에는 두 가지 새로운 추세가 나타났습니다. 하나는 사용 편의성의 향상이고, 다른 하나는 응용 방향의 개선입니다. 전자는 빅데이터 기술 사용의 문턱을 크게 낮췄고, 후자는 데이터 레이크 등 새로운 요구와 문제에 대한 새로운 솔루션을 지속적으로 제공하고 있습니다.

AI 프레임워크와의 통합 관점에서 볼 때 이제 빅데이터와 AI 생태계는 긴밀하게 통합됩니다. AI 모델의 경우 데이터 양이 많고 품질이 높을수록 모델의 훈련 효과가 높아지므로 빅데이터와 AI라는 두 분야가 자연스럽게 결합되기 때문입니다.

빅데이터 AI 분야의 프라이버시 컴퓨팅 적용 사례

그래도 빅데이터 프레임워크와 AI 프레임워크를 통합하는 것은 쉽지 않습니다. 애플리케이션 개발, 데이터 수집, 정리, 분석 및 배포 과정에서 많은 빅 데이터 및 AI 프레임워크가 관련됩니다. 주요 프로세스에서 데이터 보안과 개인 정보 보호를 보장해야 하는 경우 다양한 보안 기술, 암호화 기술, 키 관리 기술을 비롯한 많은 링크와 프레임워크가 관련되어 변환 및 마이그레이션 비용이 크게 증가합니다.

빅데이터 AI 분야의 프라이버시 컴퓨팅 적용 사례

2. 빅데이터 AI + 개인정보 보호 컴퓨팅

2년 전 업계 내 빅데이터 및 AI 애플리케이션과 관련된 고객과의 소통 과정에서 몇 가지 사용자 불만 사항을 수집했습니다. 일반적인 성능 문제 외에도 대부분의 고객이 가장 먼저 우려하는 것은 호환성 문제입니다. 예를 들어, 일부 고객은 이미 수천 또는 수만 개의 노드로 구성된 클러스터를 보유하고 있습니다. 일부 모듈이나 링크를 안전하게 처리하고 개인 정보 보호 기능을 달성하기 위해 개인 정보 보호 컴퓨팅 기술을 적용해야 하는 경우 기존 애플리케이션을 변경해야 할 수도 있습니다. , 완전히 새로운 프레임워크나 인프라를 도입하는 경우도 있습니다. 이러한 영향은 고객이 고려해야 할 주요 문제입니다. 둘째, 고객은 데이터 규모가 보안 기술에 미치는 영향을 고려하고 도입된 새로운 프레임워크와 기술이 대규모 데이터 계산을 지원하고 높은 컴퓨팅 효율성을 가질 수 있기를 바랍니다. 마지막으로 고객은 연합 학습 기술이 데이터 섬 문제를 해결할 수 있는지 고려할 것입니다.

빅데이터 AI 분야의 프라이버시 컴퓨팅 적용 사례

설문 조사에서 얻은 고객 요구 사항을 바탕으로 BigDL PPML 솔루션을 출시했습니다 , 주요 목표는 기존 및 표준 빅 데이터 및 AI 솔루션을 안전한 환경에서 실행하여 처음부터 끝까지 안전한지 확인하세요 . 이를 위해서는 SGX(하드웨어 수준 TEE)로 컴퓨팅 프로세스를 보호해야 합니다. 동시에, 저장소와 네트워크가 암호화되었는지 확인해야 하며 계산의 기밀성과 무결성을 보장하기 위해 전체 링크를 원격으로 증명(원격 서명이라고도 함)해야 합니다. ㅋㅋㅋ Apache Spark는 빅데이터 AI 분야에서 일반적으로 사용되는 분산 컴퓨팅 프레임워크로, 이미 많은 보안 관련 기능을 갖추고 있습니다. 예를 들어 네트워크를 암호화하고 인증할 수 있으며 통신 및 RPC는 주로 TLS 및 AES로 보호됩니다. 로컬 셔플 스토리지도 AES로 보호되지만 최신 버전의 Spark에서도 일반 텍스트 계산만 수행할 수 있기 때문에 계산에 큰 문제가 있습니다. 컴퓨팅 환경이나 노드가 손상되면 대량의 민감한 데이터를 얻을 수 있습니다.

빅데이터 AI 분야의 프라이버시 컴퓨팅 적용 사례

SGX technology은 Intel CPU를 기반으로 소프트웨어와 하드웨어를 결합한 신뢰할 수 있는 컴퓨팅 환경 기술입니다.

레벨 신뢰할 수 있는 실행 환경

빅데이터 AI 분야의 프라이버시 컴퓨팅 적용 사례 상대적으로 작은 공격 표면: 시스템의 일부가 손상되더라도 CPU가 안전하다면 전체 프로그램의 보안을 보장할 수 있습니다

성능에 미치는 영향 작습니다

앞서 언급한 Apache Spark 애플리케이션 시나리오로 돌아가기:
왼쪽 측면이 그렇다 컴퓨팅 환경이 보호되지 않는 경우 암호화된 저장소를 사용하더라도 일반 텍스트 계산 단계에서 공격을 받는 한 데이터 유출 위험이 있습니다. 오른쪽에는 Spark 커뮤니티가 일부 키를 추출하려는 시도가 있습니다. SparkSQL과 관련된 단계를 SGX SDK로 다시 작성합니다. 로직의 일부는 성능을 극대화할 뿐만 아니라 공격 표면을 최소화할 수도 있습니다. 그러나 이 방법의 단점도 명백하다. 즉, 개발 비용이 너무 높고 비용이 너무 높다는 것이다. SparkSQL의 핵심 로직을 재구축하려면 Spark에 대한 명확한 이해가 필요하며, 해당 코드는 다른 프로젝트에서 재사용될 수 없습니다.
위에서 언급한 단점을 해결하기 위해 LibOS 솔루션을 사용했습니다 즉, LibOS의 중간 계층을 통해 개발 및 마이그레이션의 어려움을 줄이고 통합합니다. 시스템 API 호출은 SGX SDK에서 인식할 수 있는 형식으로 변환되므로 일부 일반 애플리케이션을 원활하게 마이그레이션할 수 있습니다. 일반적인 LibOS 솔루션에는 Ant Group의 Occlum, Intel의 Gramine 및 Imperial College의 sgx-lkl 솔루션이 포함됩니다. 위의 LibOS는 모두 고유한 기능과 장점을 갖고 있으며 SGX의 사용 용이성과 이식성 문제를 다양한 방식으로 해결합니다.

LibOS를 사용하면 더 이상 Spark에서 핵심 로직을 다시 작성할 필요가 없습니다. 대신 Spark 및 기존 애플리케이션을 수정하지 않고도 LibOS를 통해 Spark 전체를 SGX에 넣을 수 있습니다.

Spark의 분산 컴퓨팅에서는 각각의 분산 모듈을 LibOS와 SGX로 보호할 수 있으며, 스토리지 측은 키 관리와 암호화된 스토리지로 구성할 수 있으며 실행자는 암호문을 얻습니다. 그런 다음 데이터는 SGX에서 해독되고 계산됩니다. 전체 프로세스는 개발자에게 상대적으로 민감하지 않으며 기존 애플리케이션에 미치는 영향도 적습니다.

그러나 독립 실행형 애플리케이션에 비해 분산 애플리케이션의 보안 문제도 더 복잡합니다. 공격자는 일부 운영 노드를 침해하거나 자원 관리 노드와 결탁하여 SGX 환경을 악성 운영 환경으로 교체할 수 있습니다. 이런 방식으로 키와 암호화된 데이터를 불법적으로 획득할 수 있으며, 궁극적으로 개인 데이터가 유출될 수 있습니다.

이 문제를 해결하려면 원격 인증 기술을 적용해야 합니다. 간단히 말해서, SGX에서 실행되는 애플리케이션은 인증서를 제공할 수 있으며 인증서 또는 인증서는 변조될 수 없습니다. 인증서는 애플리케이션이 SGX에서 실행 중인지, 애플리케이션이 변조되었는지, 플랫폼이 보안 표준을 충족하는지 여부를 확인할 수 있습니다.

분산 애플리케이션에 대한 원격 증명을 구현하는 방법에는 두 가지가 있습니다. 왼쪽은 비교적 완벽하지만 크게 수정된 솔루션입니다. 드라이버 측과 실행자 측이 서로 원격 인증을 수행하는데, 이를 위해서는 스파크에 대한 어느 정도 수정이 필요합니다. 또 다른 해결책은 타사 원격 인증 서버를 통해 중앙 집중식 원격 인증을 구현하고, 변경 불가능한 인증서를 사용하여 공격자가 제어하는 모듈의 데이터 획득을 차단하는 것입니다. 두 번째 옵션은 애플리케이션 수정이 필요하지 않으며 시작 스크립트의 일부만 수정하면 됩니다.

LibOS에서는 Spark를 SGX에서 실행할 수 있지만 Spark를 LibOS 및 SGX에 적용하려면 여전히 일정량의 인력과 시간이 필요합니다. 이를 위해 우리는 PPML의 원스톱 솔루션을 출시했는데, 그 중 다수는 자동화되고 원활하게 마이그레이션되어 마이그레이션 비용을 크게 절감할 수 있습니다.

워크플로우 관점에서 이 솔루션은 또 다른 이점을 가지고 있습니다. 즉, 데이터 과학자가 근본적인 변경 사항을 인식할 수 없다는 것입니다. 클러스터 관리자만 SGX 배포 및 준비에 참여하면 되며, 데이터 과학자는 모델링 및 쿼리 작업을 정상적으로 진행할 수 있습니다. 기본 환경이 변경되었다는 사실을 전혀 인식하지 못합니다. 이는 기존 애플리케이션의 호환성 및 마이그레이션 문제를 잘 해결할 수 있으며 데이터 과학자와 개발자의 일상적인 작업을 방해하지 않습니다.

다음은 전체 PPML 솔루션의 전체 그림입니다. 고객의 다양한 요구를 충족하기 위해 PPML이 지원하는 기능은 지난 2년 동안 지속적으로 확장되었습니다. 예를 들어 중간 계층 라이브러리 및 프레임워크에서는 Spark, Flink 및 Ray와 같이 일반적으로 사용되는 컴퓨팅 프레임워크가 모두 동시에 지원되며 PPML은 기계 학습, 딥 러닝 및 연합 학습 기능도 지원합니다. 암호화된 저장 및 동형 암호화를 지원하여 엔드투엔드 전체 링크 보안을 보장합니다. ㅋㅋㅋ 작년 한 하위 대회에서 참가자들은 PPML이 제공하는 Flink 기능과 Ant Group의 LibOS 프로젝트 Occlum을 결합하여 훈련 및 모델 추론 과정을 SGX로 완벽하게 보호할 수 있기를 바랐습니다. 응용 프로그램 수준에서. 결국 전체 대회에는 4,000개 이상의 팀이 참가했고, 수백 대의 서버가 사용되면서 PPML이 대규모 상업적 활용도 지원할 수 있음이 입증됐고, 전반적으로 사업자들은 큰 변화를 느끼지 못했다.

같은 해 9월~10월, 한국통신은 BigDL과 Flink를 기반으로 하는 엔드 투 엔드 보안 실시간 모델 추론 환경을 구축하기를 희망했습니다. 더 엄격해졌습니다. Tianchi의 경험 이후, Flink 및 SGX를 기반으로 하는 BigDL의 실시간 모델 추론 솔루션은 더욱 성숙해졌으며, 종단 간 성능 손실은 5% 미만이며 처리량도 한국 통신의 기본 요구 사항을 충족했습니다.

Spark 성능 테스트도 진행했습니다. 결론적으로, 테스트 데이터가 수백 GB에 도달하더라도 PPML 솔루션이 Spark를 실행하면 확장성 및 성능 문제가 없습니다. 고객의 요구에 따라 SGX에 친숙하지 않은 IO 집약적 애플리케이션인 TPC-DS를 특별히 선택했습니다. TPC-DS는 일반적으로 사용되는 SQL 벤치마크 표준으로, IO 및 컴퓨팅 요구 사항이 상대적으로 높으며, 데이터 양이 많을 경우 대규모 디스크, 메모리 및 네트워크 IO가 발생합니다. 하드웨어 수준의 TEE로서 SGX에 들어오고 나가는 데이터는 해독 및 암호화되어야 하므로 데이터를 읽고 쓰는 비용은 SGX가 아닌 경우보다 더 큽니다. 완전한 TPC-DS 테스트 후 전체 엔드투엔드 손실이 2배 이내로 고객 기대치를 충족했습니다. TPC-DS 벤치마크를 통해 우리는 최악의 경우에도 종단간 손실을 허용 가능한 범위(1.8)로 줄일 수 있음을 입증했습니다.

빅데이터 애플리케이션의 원활한 마이그레이션을 실현한 후 일부 고객과 연합 학습도 시도했습니다. SGX는 안전한 환경을 제공하므로 연합 학습 프로세스에서 가장 중요한 서버 및 로컬 데이터 보안 문제를 해결할 수 있습니다. BigDL에서 제공하는 연합학습 솔루션은 일반 솔루션과 큰 차이가 있습니다. 즉, 전체 솔루션은 본질적으로 대규모 데이터를 위한 연합학습 솔루션입니다. 그 중 각 작업자의 작업량과 데이터 크기는 상대적으로 크며 각 작업자는 작은 클러스터에 해당합니다. 우리는 일부 고객을 대상으로 이 솔루션의 타당성과 효율성을 검증했습니다.

04 요약 및 전망

위에서 언급한 것처럼 2년 넘게 고객과 소통하고 협력하면서 우리는 개인 정보 보호 컴퓨팅 및 빅 데이터 AI와 관련된 몇 가지 문제점을 발견했습니다. 이러한 문제점은 SGX와 같은 보안 기술을 통해 해결될 수 있습니다. 그중 LibOS는 호환성 문제를 해결할 수 있고, SGX는 보안 환경 및 성능 문제를 해결할 수 있으며, Spark 또는 Flink 지원은 빅 데이터 및 마이그레이션 문제를 해결할 수 있습니다. BigDL PPML은 위의 서비스를 통합한 원스톱 개인정보 보호 컴퓨팅 솔루션입니다.

SGX와 TEE의 생태계는 현재 빠르게 발전하고 있습니다. 가까운 미래에 TEE는 사용 편의성, 보안 및 성능 측면에서 크게 향상될 것입니다. 예를 들어 Intel의 차세대 TDX는 OS 지원을 직접 제공하여 애플리케이션 호환성 문제를 근본적으로 해결할 수 있습니다. 커뮤니티도 개선되고 있습니다. 기밀 컨테이너를 지원하여 컨테이너 보안을 보장하고 애플리케이션 마이그레이션 비용을 크게 절감합니다. 보안 관점에서 보면 마이크로커널과 같은 작업도 TEE 생태계의 보안을 더욱 강화하는 것으로 나타날 것입니다. 확장성 관점에서 인텔과 커뮤니티는 가속기 및 IO 장치에 대한 지원을 촉진하여 데이터 흐름의 성능 오버헤드를 줄이기 위해 이를 신뢰할 수 있는 도메인으로 가져왔습니다.