오라클이나 기타 관계형 데이터베이스를 사용해 본 DBA나 개발자들은 모두 데이터베이스가 하위 쿼리에 최적화되어 있어 테이블 실행을 유도하는 데 좋은 선택을 할 수 있다고 생각하지만, 이 경험을 MySQL 데이터베이스에 이식할 수 있습니다. 안타깝게도 mysql은 하위 쿼리 처리에 있어 실망스러울 수 있습니다. 우리 프로덕션 시스템에서는 다음과 같은 문제가 발생했습니다.
select i_id, sum(i_sell) as i_sell from table_data where i_id in (select i_id from table_data where Gmt_create >= ‘2011-10-07 00:00:00’) group by i_id;
(참고: SQL의 비즈니스 논리는 비유로 사용할 수 있습니다. 쿼리 우선 10에 새로 판매된 100권의 책을 출판하십시오. -07을 선택한 다음 일년 내내 새로 판매된 책 100권의 판매량을 쿼리합니다.
이 SQL의 성능 문제는 하위 쿼리를 처리하는 mysql 최적화 프로그램의 약점으로 인해 발생합니다. 일반적으로 우리는 먼저 내부에서 외부로 하위 쿼리의 결과를 완성한 다음 하위 쿼리를 사용하여 외부 쿼리 테이블을 구동하여 쿼리를 완료하려고 합니다. 그러나 mysql 처리에서는 먼저 외부 테이블의 모든 데이터를 스캔합니다. 그리고 각 데이터는 하위 쿼리로 전송되어 하위 쿼리와 연결됩니다. 모양이 너무 크면 성능 문제가 발생합니다.
위 쿼리의 경우 table_data 테이블의 데이터가 동시에 70W입니다. 많은 양의 데이터가 있고 그 양이 반복되어 거의 700,000개의 상관 관계가 필요합니다. 상관 관계가 너무 많아 이 SQL이 완료되지 않고 몇 시간 동안 실행되므로 다시 작성해야 합니다. sql:
SELECT t2.i_id, SUM(t2.i_sell) AS sold FROM (SELECT distinct i_id FROM table_data WHERE gmt_create >= ‘2011-10-07 00:00:00’) t1, table_data t2 WHERE t1.i_id = t2.i_id GROUP BY t2.i_id;
서브 쿼리를 변경합니다. 상관 관계를 지정하기 위해 서브 쿼리에 구별을 추가하여 t1이 t2와 관련되는 횟수를 줄입니다.
변환 후 SQL 실행 시간이 100ms 미만으로 떨어졌습니다.
위 내용은 프로덕션 라이브러리의 mysql에서 발생하는 하위 쿼리 예제에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!