> 백엔드 개발 > PHP 튜토리얼 > PHP 프로그래머가 저지르는 10가지 흔한 실수 (공유)

PHP 프로그래머가 저지르는 10가지 흔한 실수 (공유)

青灯夜游
풀어 주다: 2023-04-10 07:06:02
앞으로
3052명이 탐색했습니다.

이 기사에서는 PHP 개발자가 저지르는 가장 일반적인 실수 10가지를 소개합니다. 도움이 필요한 친구들이 모두 참고할 수 있기를 바랍니다.

PHP 프로그래머가 저지르는 10가지 흔한 실수 (공유)

PHP 언어는 웹 프로그래밍을 단순하게 만들어주므로 인기를 얻게 됩니다. 그러나 단순성으로 인해 PHP는 끝없는 프레임워크, 다양한 언어 기능 및 버전 차이로 인해 종종 혼란스러워지고 디버깅에 많은 시간을 낭비해야 하는 상대적으로 복잡한 언어로 발전했습니다. 이 글에는 우리가 주목해야 할 가장 흔한 실수 10가지가 나열되어 있습니다.

일반적인 실수 #1: foreach 루프

후에 배열 참조 남기기foreach循环后留下数组的引用

还不清楚 PHP 中 foreach 遍历的工作原理?如果你在想遍历数组时操作数组中每个元素,在 foreach 循环中使用引用会十分方便,例如

$arr = array(1, 2, 3, 4);
foreach ($arr as &$value) {
        $value = $value * 2;
}
// $arr 现在是 array(2, 4, 6, 8)
로그인 후 복사

问题是,如果你不注意的话这会导致一些意想不到的负面作用。在上述例子,在代码执行完以后,$value 仍保留在作用域内,并保留着对数组最后一个元素的引用。之后与 $value 相关的操作会无意中修改数组中最后一个元素的值。

你要记住 foreach 并不会产生一个块级作用域。因此,在上面例子中 $value 是一个全局引用变量。在 foreach 遍历中,每一次迭代都会形成一个对 $arr 下一个元素的引用。当遍历结束后, $value 会引用 $arr 的最后一个元素,并保留在作用域中

这种行为会导致一些不易发现的,令人困惑的bug,以下是一个例子

$array = [1, 2, 3];
echo implode(',', $array), "\n";

foreach ($array as &$value) {}    // 通过引用遍历
echo implode(',', $array), "\n";

foreach ($array as $value) {}     // 通过赋值遍历
echo implode(',', $array), "\n";
로그인 후 복사

以上代码会输出

1,2,3
1,2,3
1,2,2
로그인 후 복사

你没有看错,最后一行的最后一个值是 2 ,而不是 3 ,为什么?

在完成第一个 foreach 遍历后, $array 并没有改变,但是像上述解释的那样, $value 留下了一个对 $array 最后一个元素的危险的引用(因为 foreach 通过引用获得 $value

这导致当运行到第二个 foreach ,这个"奇怪的东西"发生了。当 $value 通过赋值获得, foreach 按顺序复制每个 $array 的元素到 $value 时,第二个 foreach 里面的细节是这样的

  • 第一步:复制 $array[0] (也就是 1 )到 $value$value 其实是 $array最后一个元素的引用,即 $array[2]),所以 $array[2] 现在等于 1。所以 $array 现在包含 [1, 2, 1]
  • 第二步:复制 $array[1](也就是 2 )到 $value$array[2] 的引用),所以 $array[2] 现在等于 2。所以 $array 现在包含 [1, 2, 2]
  • 第三步:复制 $array[2](现在等于 2 ) 到 $value$array[2] 的引用),所以 $array[2] 现在等于 2 。所以 $array 现在包含 [1, 2, 2]

为了在 foreach 中方便的使用引用而免遭这种麻烦,请在 foreach 执行完毕后 unset() 掉这个保留着引用的变量。例如

$arr = array(1, 2, 3, 4);
foreach ($arr as &$value) {
    $value = $value * 2;
}
unset($value);   // $value 不再引用 $arr[3]
로그인 후 복사

常见错误 #2: 误解 isset() 的行为

尽管名字叫 isset,但是 isset() 不仅会在变量不存在的时候返回 false,在变量值为 null 的时候也会返回 false

这种行为比最初出现的问题更为棘手,同时也是一种常见的错误源。

看看下面的代码:

$data = fetchRecordFromStorage($storage, $identifier);
if (!isset($data['keyShouldBeSet']) {
    // do something here if 'keyShouldBeSet' is not set
}
로그인 후 복사

开发者想必是想确认 keyShouldBeSet 是否存在于 $data 中。然而,正如上面说的,如果 $data['keyShouldBeSet'] 存在并且值为 null 的时候, isset($data['keyShouldBeSet']) 也会返回 false。所以上面的逻辑是不严谨的。

我们来看另外一个例子:

if ($_POST['active']) {
    $postData = extractSomething($_POST);
}

// ...

if (!isset($postData)) {
    echo 'post not active';
}
로그인 후 복사

上述代码,通常认为,假如 $_POST['active'] 返回 true,那么 postData 必将存在,因此 isset($postData) 也将返回 true。反之, isset($postData) 返回 false 的唯一可能是 $_POST['active'] 也返回 falsePHP 원칙에서 foreach 순회가 어떻게 작동하는지 명확하지 않습니까? foreach 루프에서 참조를 사용하는 것은

if ($_POST['active']) {
    $postData = extractSomething($_POST);
}

// ...

if ($_POST['active']) {
    echo 'post not active';
}
로그인 후 복사
로그인 후 복사

와 같이 배열을 반복할 때 배열의 각 요소를 조작하려는 경우 매우 편리할 수 있습니다. 문제는 이로 인해 예상치 못한 결과가 발생할 수 있다는 것입니다. 조심하지 않으면 부정적인 영향을 미칠 수 있습니다. 위의 예에서 코드가 실행된 후 $value는 범위 내에 유지되며 배열의 마지막 요소에 대한 참조를 유지합니다. $value와 관련된 후속 작업으로 인해 배열의 마지막 요소 값이 실수로 수정될 수 있습니다.

🎜foreach는 블록 범위를 생성하지 않는다는 점을 기억해야 합니다. 따라서 위의 예에서 $value는 전역 참조 변수입니다. foreach 순회에서 각 반복은 $arr 다음 요소에 대한 참조를 형성합니다. 순회가 완료되면 $value$arr의 마지막 요소를 참조하고 범위에 유지됩니다. 이 동작은 찾기 어렵고 혼란스럽게 만듭니다. 혼란스러운 버그, 여기에 예가 있습니다🎜
$data = fetchRecordFromStorage($storage, $identifier);
if (! array_key_exists('keyShouldBeSet', $data)) {
    // do this if 'keyShouldBeSet' isn't set
}
로그인 후 복사
로그인 후 복사
🎜위 코드는 출력됩니다🎜
if (array_key_exists('varShouldBeSet', get_defined_vars())) {
    // variable $varShouldBeSet exists in current scope
}
로그인 후 복사
로그인 후 복사
🎜맞게 읽으셨습니다. 마지막 줄의 마지막 값은 3이 아니라 2입니다. 왜죠? 🎜🎜첫 번째 foreach 순회를 완료한 후 $array는 변경되지 않지만 위에서 설명한 대로 $value는 마지막에 대한 위험한 참조로 남아 있습니다. $array의 요소(foreach가 참조로 $value를 가져오기 때문) 🎜🎜이렇게 하면 두 번째 요소가 foreach</code가 됩니다. >, 이런 "이상한 일"이 일어났습니다. 할당을 통해 <code>$value를 얻은 경우 foreach는 각 $array의 요소를 $value에 순차적으로 복사합니다. 두 번째 foreach의 세부 사항은 다음과 같습니다🎜
  • 1단계: $array[0](즉, 1)를 $value에 복사합니다. ($value는 실제로 $array의 마지막 요소, 즉 $array[2]에 대한 참조입니다), 따라서 < code>$array[2]는 이제 1과 같습니다. 따라서 $array에는 이제 [1, 2, 1]이 포함됩니다.
  • 2단계: $array[1](즉, 2)를 < code>$value($array[2]에 대한 참조)이므로 $array[2]는 이제 2와 같습니다. 따라서 $array에는 이제 [1, 2, 2]가 포함됩니다.
  • 3단계: $array[2](현재 2와 같음)를 < code>$value($array[2]에 대한 참조)이므로 $array[2]는 이제 2와 같습니다. 따라서 $array에는 이제 [1, 2, 2]가 포함됩니다.
🎜 foreach에서 참조를 편리하게 사용하여 이 문제를 방지하려면 < code>unset() foreach가 실행된 후 참조를 유지하는 변수를 제거합니다. 예를 들어🎜
class Config
{
    private $values = [];

    public function getValues() {
        return $this-&amp;gt;values;
    }
}

$config = new Config();

$config-&amp;gt;getValues()[&amp;amp;#39;test&amp;amp;#39;] = &amp;amp;#39;test&amp;amp;#39;;
echo $config-&amp;gt;getValues()[&amp;amp;#39;test&amp;amp;#39;];
로그인 후 복사
로그인 후 복사

🎜일반적인 실수 #2: isset()

의 동작을 오해함🎜이름은 다음과 같지만 isset 이지만 isset() 변수에만 사용되는 것이 아닙니다. 존재하지 않는 경우 false를 반환합니다. 변수 값이 null인 경우에도 false가 반환됩니다. 🎜🎜이 동작은 처음에 나타난 것보다 더 문제가 많으며 일반적인 오류 원인입니다. 🎜🎜다음 코드를 보세요: 🎜
PHP Notice:  Undefined index: test in /path/to/my/script.php on line 21
로그인 후 복사
로그인 후 복사
🎜개발자는 $datakeyShouldBeSet가 존재하는지 확인해야 합니다. 그러나 위에서 언급한 것처럼 $data['keyShouldBeSet']가 존재하고 값이 null인 경우 isset($data['keyShouldBeSet']) &amp;lt;/ code&amp;gt;도 &amp;lt;code&amp;gt;false를 반환합니다. 따라서 위의 논리는 엄격하지 않습니다. 🎜🎜다른 예를 살펴보겠습니다. 🎜
// getValues() 返回了一个 $values 数组的拷贝
// 所以`test`元素被添加到了这个拷贝中,而不是 $values 数组本身。
$config-&amp;gt;getValues()[&amp;amp;#39;test&amp;amp;#39;] = &amp;amp;#39;test&amp;amp;#39;;


// getValues() 又返回了另一份 $values 数组的拷贝
// 且这份拷贝中并不包含一个`test`元素(这就是为什么我们会得到 「未定义索引」 消息)。
echo $config-&amp;gt;getValues()[&amp;amp;#39;test&amp;amp;#39;];
로그인 후 복사
로그인 후 복사
🎜위 코드의 경우 일반적으로 $_POST['active']true를 반환하면 postData&amp;lt;/ code&amp;gt;가 존재해야 하므로 &amp;lt;code&amp;gt;isset($postData)true를 반환합니다. 반대로 isset($postData)false를 반환할 수 있는 유일한 가능성은 $_POST['active']를 반환한다는 것입니다. &amp;gt;거짓 >. 🎜🎜하지만 그렇지 않아요! 🎜

如我所言,如果$postData 存在且被设置为 nullisset($postData) 也会返回 false 。 也就是说,即使 $_POST[&amp;amp;#39;active&amp;amp;#39;] 返回 trueisset($postData) 也可能会返回 false 。 再一次说明上面的逻辑不严谨。

顺便一提,如果上面代码的意图真的是再次确认 $_POST[&amp;amp;#39;active&amp;amp;#39;] 是否返回 true,依赖 isset() 来做,不管对于哪种场景来说都是一种糟糕的决定。更好的做法是再次检查 $_POST[&amp;amp;#39;active&amp;amp;#39;],即:

if ($_POST[&amp;amp;#39;active&amp;amp;#39;]) {
    $postData = extractSomething($_POST);
}

// ...

if ($_POST[&amp;amp;#39;active&amp;amp;#39;]) {
    echo &amp;amp;#39;post not active&amp;amp;#39;;
}
로그인 후 복사
로그인 후 복사

对于这种情况,虽然检查一个变量是否真的存在很重要(即:区分一个变量是未被设置还是被设置为 null);但是使用 array_key_exists() 这个函数却是个更健壮的解决途径。

比如,我们可以像下面这样重写上面第一个例子:

$data = fetchRecordFromStorage($storage, $identifier);
if (! array_key_exists(&amp;amp;#39;keyShouldBeSet&amp;amp;#39;, $data)) {
    // do this if &amp;amp;#39;keyShouldBeSet&amp;amp;#39; isn&amp;amp;#39;t set
}
로그인 후 복사
로그인 후 복사

另外,通过结合 array_key_exists()get_defined_vars(), 我们能更加可靠的判断一个变量在当前作用域中是否存在:

if (array_key_exists(&amp;amp;#39;varShouldBeSet&amp;amp;#39;, get_defined_vars())) {
    // variable $varShouldBeSet exists in current scope
}
로그인 후 복사
로그인 후 복사

常见错误 #3:关于通过引用返回与通过值返回的困惑

考虑下面的代码片段:

class Config
{
    private $values = [];

    public function getValues() {
        return $this-&amp;gt;values;
    }
}

$config = new Config();

$config-&amp;gt;getValues()[&amp;amp;#39;test&amp;amp;#39;] = &amp;amp;#39;test&amp;amp;#39;;
echo $config-&amp;gt;getValues()[&amp;amp;#39;test&amp;amp;#39;];
로그인 후 복사
로그인 후 복사

如果你运行上面的代码,将得到下面的输出:

PHP Notice:  Undefined index: test in /path/to/my/script.php on line 21
로그인 후 복사
로그인 후 복사

出了什么问题?

上面代码的问题在于没有搞清楚通过引用与通过值返回数组的区别。除非你明确告诉 PHP 通过引用返回一个数组(例如,使用 &amp;),否则 PHP 默认将会「通过值」返回这个数组。这意味着这个数组的一份拷贝将会被返回,因此被调函数与调用者所访问的数组并不是同样的数组实例。

所以上面对 getValues() 的调用将会返回 $values 数组的一份拷贝,而不是对它的引用。考虑到这一点,让我们重新回顾一下以上例子中的两个关键行:

// getValues() 返回了一个 $values 数组的拷贝
// 所以`test`元素被添加到了这个拷贝中,而不是 $values 数组本身。
$config-&amp;gt;getValues()[&amp;amp;#39;test&amp;amp;#39;] = &amp;amp;#39;test&amp;amp;#39;;


// getValues() 又返回了另一份 $values 数组的拷贝
// 且这份拷贝中并不包含一个`test`元素(这就是为什么我们会得到 「未定义索引」 消息)。
echo $config-&amp;gt;getValues()[&amp;amp;#39;test&amp;amp;#39;];
로그인 후 복사
로그인 후 복사

一个可能的修改方法是存储第一次通过 getValues() 返回的 $values 数组拷贝,然后后续操作都在那份拷贝上进行;例如:

$vals = $config-&amp;gt;getValues();
$vals[&amp;amp;#39;test&amp;amp;#39;] = &amp;amp;#39;test&amp;amp;#39;;
echo $vals[&amp;amp;#39;test&amp;amp;#39;];
로그인 후 복사

这段代码将会正常工作(例如,它将会输出test而不会产生任何「未定义索引」消息),但是这个方法可能并不能满足你的需求。特别是上面的代码并不会修改原始的$values数组。如果你想要修改原始的数组(例如添加一个test元素),就需要修改getValues()函数,让它返回一个$values数组自身的引用。通过在函数名前面添加一个&amp;来说明这个函数将返回一个引用;例如:

class Config
{
    private $values = [];

    // 返回一个 $values 数组的引用
    public function &amp;amp;getValues() {
        return $this-&amp;gt;values;
    }
}

$config = new Config();

$config-&amp;gt;getValues()[&amp;amp;#39;test&amp;amp;#39;] = &amp;amp;#39;test&amp;amp;#39;;
echo $config-&amp;gt;getValues()[&amp;amp;#39;test&amp;amp;#39;];
로그인 후 복사

这会输出期待的test

但是现在让事情更困惑一些,请考虑下面的代码片段:

class Config
{
    private $values;

    // 使用数组对象而不是数组
    public function __construct() {
        $this-&amp;gt;values = new ArrayObject();
    }

    public function getValues() {
        return $this-&amp;gt;values;
    }
}

$config = new Config();

$config-&amp;gt;getValues()[&amp;amp;#39;test&amp;amp;#39;] = &amp;amp;#39;test&amp;amp;#39;;
echo $config-&amp;gt;getValues()[&amp;amp;#39;test&amp;amp;#39;];
로그인 후 복사

如果你认为这段代码会导致与之前的数组例子一样的「未定义索引」错误,那就错了。实际上,这段代码将会正常运行。原因是,与数组不同,PHP 永远会将对象按引用传递。(ArrayObject 是一个 SPL 对象,它完全模仿数组的用法,但是却是以对象来工作。)

像以上例子说明的,你应该以引用还是拷贝来处理通常不是很明显就能看出来。因此,理解这些默认的行为(例如,变量和数组以值传递;对象以引用传递)并且仔细查看你将要调用的函数 API 文档,看看它是返回一个值,数组的拷贝,数组的引用或是对象的引用是必要的。

尽管如此,我们要认识到应该尽量避免返回一个数组或 ArrayObject,因为这会让调用者能够修改实例对象的私有数据。这就破坏了对象的封装性。所以最好的方式是使用传统的「getters」和「setters」,例如:

class Config
{
    private $values = [];

    public function setValue($key, $value) {
        $this-&amp;gt;values[$key] = $value;
    }

    public function getValue($key) {
        return $this-&amp;gt;values[$key];
    }
}

$config = new Config();

$config-&amp;gt;setValue(&amp;amp;#39;testKey&amp;amp;#39;, &amp;amp;#39;testValue&amp;amp;#39;);
echo $config-&amp;gt;getValue(&amp;amp;#39;testKey&amp;amp;#39;);    // 输出『testValue』
로그인 후 복사

这个方法让调用者可以在不对私有的$values数组本身进行公开访问的情况下设置或者获取数组中的任意值。

常见的错误 #4:在循环中执行查询

如果像这样的话,一定不难见到你的 PHP 无法正常工作。

$models = [];

foreach ($inputValues as $inputValue) {
    $models[] = $valueRepository-&amp;gt;findByValue($inputValue);
}
로그인 후 복사

这里也许没有真正的错误, 但是如果你跟随着代码的逻辑走下去, 你也许会发现这个看似无害的调用$valueRepository->findByValue() 最终执行了这样一种查询,例如:

$result = $connection-&amp;gt;query(&amp;quot;SELECT `x`,`y` FROM `values` WHERE `value`=&amp;quot; . $inputValue);
로그인 후 복사

结果每轮循环都会产生一次对数据库的查询。 因此,假如你为这个循环提供了一个包含 1000 个值的数组,它会对资源产生 1000 单独的请求!如果这样的脚本在多个线程中被调用,他会有导致系统崩溃的潜在危险。

因此,至关重要的是,当你的代码要进行查询时,应该尽可能的收集需要用到的值,然后在一个查询中获取所有结果。

一个我们平时常常能见到查询效率低下的地方 (例如:在循环中)是使用一个数组中的值 (比如说很多的 ID )向表发起请求。检索每一个 ID 的所有的数据,代码将会迭代这个数组,每个 ID 进行一次SQL查询请求,它看起来常常是这样:

$data = [];
foreach ($ids as $id) {
    $result = $connection-&amp;gt;query(&amp;quot;SELECT `x`, `y` FROM `values` WHERE `id` = &amp;quot; . $id);
    $data[] = $result-&amp;gt;fetch_row();
}
로그인 후 복사

但是 只用一条 SQL 查询语句就可以更高效的完成相同的工作,比如像下面这样:

$data = [];
if (count($ids)) {
    $result = $connection-&amp;gt;query(&amp;quot;SELECT `x`, `y` FROM `values` WHERE `id` IN (&amp;quot; . implode(&amp;amp;#39;,&amp;amp;#39;, $ids));
    while ($row = $result-&amp;gt;fetch_row()) {
        $data[] = $row;
    }
}
로그인 후 복사

因此在你的代码直接或间接进行查询请求时,一定要认出这种查询。尽可能的通过一次查询得到想要的结果。然而,依然要小心谨慎,不然就可能会出现下面我们要讲的另一个易犯的错误...

常见问题 #5: 内存使用欺骗与低效

一次取多条记录肯定是比一条条的取高效,但是当我们使用 PHP 的 mysql 扩展的时候,这也可能成为一个导致 libmysqlclient 出现『内存不足』(out of memory)的条件。

我们在一个测试盒里演示一下,该测试盒的环境是:有限的内存(512MB RAM),MySQL,和 php-cli

我们将像下面这样引导一个数据表:

// 连接 mysql
$connection = new mysqli(&amp;amp;#39;localhost&amp;amp;#39;, &amp;amp;#39;username&amp;amp;#39;, &amp;amp;#39;password&amp;amp;#39;, &amp;amp;#39;database&amp;amp;#39;);

// 创建 400 个字段
$query = &amp;amp;#39;CREATE TABLE `test`(`id` INT NOT NULL PRIMARY KEY AUTO_INCREMENT&amp;amp;#39;;
for ($col = 0; $col &amp;lt; 400; $col++) {
    $query .= &amp;quot;, `col$col` CHAR(10) NOT NULL&amp;quot;;
}
$query .= &amp;amp;#39;);&amp;amp;#39;;
$connection-&amp;gt;query($query);

// 写入 2 百万行数据
for ($row = 0; $row &amp;lt; 2000000; $row++) {
    $query = &amp;quot;INSERT INTO `test` VALUES ($row&amp;quot;;
    for ($col = 0; $col &amp;lt; 400; $col++) {
        $query .= &amp;amp;#39;, &amp;amp;#39; . mt_rand(1000000000, 9999999999);
    }
    $query .= &amp;amp;#39;)&amp;amp;#39;;
    $connection-&amp;gt;query($query);
}
로그인 후 복사

OK,现在让我们一起来看一下内存使用情况:

// 连接 mysql
$connection = new mysqli(&amp;amp;#39;localhost&amp;amp;#39;, &amp;amp;#39;username&amp;amp;#39;, &amp;amp;#39;password&amp;amp;#39;, &amp;amp;#39;database&amp;amp;#39;);
echo &amp;quot;Before: &amp;quot; . memory_get_peak_usage() . &amp;quot;\n&amp;quot;;

$res = $connection-&amp;gt;query(&amp;amp;#39;SELECT `x`,`y` FROM `test` LIMIT 1&amp;amp;#39;);
echo &amp;quot;Limit 1: &amp;quot; . memory_get_peak_usage() . &amp;quot;\n&amp;quot;;

$res = $connection-&amp;gt;query(&amp;amp;#39;SELECT `x`,`y` FROM `test` LIMIT 10000&amp;amp;#39;);
echo &amp;quot;Limit 10000: &amp;quot; . memory_get_peak_usage() . &amp;quot;\n&amp;quot;;
로그인 후 복사

输出结果是:

Before: 224704
Limit 1: 224704
Limit 10000: 224704
로그인 후 복사

Cool。 看来就内存使用而言,内部安全地管理了这个查询的内存。

为了更加明确这一点,我们把限制提高一倍,使其达到 100,000。 额~如果真这么干了,我们将会得到如下结果:

PHP Warning:  mysqli::query(): (HY000/2013):
              Lost connection to MySQL server during query in /root/test.php on line 11
로그인 후 복사

究竟发生了啥?

这就涉及到 PHP 的 mysql 模块的工作方式的问题了。它其实只是个 libmysqlclient 的代理,专门负责干脏活累活。每查出一部分数据后,它就立即把数据放入内存中。由于这块内存还没被 PHP 管理,所以,当我们在查询里增加限制的数量的时候, memory_get_peak_usage() 不会显示任何增加的资源使用情况 。我们被『内存管理没问题』这种自满的思想所欺骗了,所以才会导致上面的演示出现那种问题。 老实说,我们的内存管理确实是有缺陷的,并且我们也会遇到如上所示的问题。

如果使用 mysqlnd 模块的话,你至少可以避免上面那种欺骗(尽管它自身并不会提升你的内存利用率)。 mysqlnd 被编译成原生的 PHP 扩展,并且确实 使用 PHP 的内存管理器。

因此,如果使用 mysqlnd 而不是 mysql,我们将会得到更真实的内存利用率的信息:

Before: 232048
Limit 1: 324952
Limit 10000: 32572912
로그인 후 복사

顺便一提,这比刚才更糟糕。根据 PHP 的文档所说,mysql 使用 mysqlnd 两倍的内存来存储数据, 所以,原来使用 mysql 那个脚本真正使用的内存比这里显示的更多(大约是两倍)。

为了避免出现这种问题,考虑限制一下你查询的数量,使用一个较小的数字来循环,像这样:

$totalNumberToFetch = 10000;
$portionSize = 100;

for ($i = 0; $i &amp;lt;= ceil($totalNumberToFetch / $portionSize); $i++) {
    $limitFrom = $portionSize * $i;
    $res = $connection-&amp;gt;query(
                         &amp;quot;SELECT `x`,`y` FROM `test` LIMIT $limitFrom, $portionSize&amp;quot;);
}
로그인 후 복사

当我们把这个常见错误和上面的 常见错误 #4 结合起来考虑的时候, 就会意识到我们的代码理想需要在两者间实现一个平衡。是让查询粒度化和重复化,还是让单个查询巨大化。生活亦是如此,平衡不可或缺;哪一个极端都不好,都可能会导致 PHP 无法正常运行。

常见错误 #6: 忽略 Unicode/UTF-8 的问题

从某种意义上说,这实际上是PHP本身的一个问题,而不是你在调试 PHP 时遇到的问题,但是它从未得到妥善的解决。 PHP 6 的核心就是要做到支持 Unicode。但是随着 PHP 6 在 2010 年的暂停而搁置了。

这并不意味着开发者能够避免 正确处理 UTF-8 并避免做出所有字符串必须是『古老的 ASCII』的假设。 没有正确处理非 ASCII 字符串的代码会因为引入粗糙的 海森堡bug(heisenbugs) 而变得臭名昭著。当一个名字包含 『Schrödinger』的人注册到你的系统时,即使简单的 strlen($_POST[&amp;#39;name&amp;#39;]) 调用也会出现问题。

下面是一些可以避免出现这种问题的清单:

  • 如果你对 UTF-8 还不了解,那么你至少应该了解下基础的东西。 这儿 有个很好的引子。
  • 确保使用 mb_* 函数代替老旧的字符串处理函数(需要先保证你的 PHP 构建版本开启了『多字节』(multibyte)扩展)。
  • 确保你的数据库和表设置了 Unicode 编码(许多 MySQL 的构建版本仍然默认使用 latin1 )。
  • 记住 json_encode() 会转换非 ASCII 标识(比如: 『Schrödinger』会被转换成 『Schru00f6dinger』),但是 serialize() 不会 转换。
  • 确保 PHP 文件也是 UTF-8 编码,以避免在连接硬编码字符串或者配置字符串常量的时候产生冲突。

常见错误 #7: 认为 $_POST 总是包含你 POST 的数据

不管它的名称,$_POST 数组不是总是包含你 POST 的数据,他也有可能会是空的。 为了理解这一点,让我们来看一下下面这个例子。假设我们使用 jQuery.ajax() 模拟一个服务请求,如下:

// js
$.ajax({
    url: &amp;amp;#39;http://my.site/some/path&amp;amp;#39;,
    method: &amp;amp;#39;post&amp;amp;#39;,
    data: JSON.stringify({a: &amp;amp;#39;a&amp;amp;#39;, b: &amp;amp;#39;b&amp;amp;#39;}),
    contentType: &amp;amp;#39;application/json&amp;amp;#39;
});
로그인 후 복사

(顺带一提,注意这里的 contentType: &amp;#39;application/json&amp;#39; 。我们用 JSON 类型发送数据,这在接口中非常流行。这在 AngularJS $http service 里是默认的发送数据的类型。)

在我们举例子的服务端,我们简单的打印一下 $_POST 数组:

// php
var_dump($_POST);
로그인 후 복사

奇怪的是,结果如下:

array(0) { }
로그인 후 복사

为什么?我们的 JSON 串 {a: &amp;#39;a&amp;#39;, b: &amp;#39;b&amp;#39;} 究竟发生了什么?

原因在于 当内容类型为 application/x-www-form-urlencoded 或者 multipart/form-data 的时候 PHP 只会自动解析一个 POST 的有效内容。这里面有历史的原因 --- 这两种内容类型是在 PHP 的 $_POST 实现前就已经在使用了的两个重要的类型。所以不管使用其他任何内容类型 (即使是那些现在很流行的,像 application/json), PHP 也不会自动加载到 POST 的有效内容。

既然 $_POST 是一个超级全局变量,如果我们重写 一次 (在我们的脚本里尽可能早的),被修改的值(包括 POST 的有效内容)将可以在我们的代码里被引用。这很重要因为 $_POST 已经被 PHP 框架和几乎所有的自定义的脚本普遍使用来获取和传递请求数据。

所以,举个例子,当处理一个内容类型为 application/json 的 POST 有效内容的时候 ,我们需要手动解析请求内容(decode 出 JSON 数据)并且覆盖 $_POST 变量,如下:

// php
$_POST = json_decode(file_get_contents(&amp;amp;#39;php://input&amp;amp;#39;), true);
로그인 후 복사

然后当我们打印 $_POST 数组的时候,我们可以看到他正确的包含了 POST 的有效内容;如下:

array(2) { [&amp;quot;a&amp;quot;]=&amp;gt; string(1) &amp;quot;a&amp;quot; [&amp;quot;b&amp;quot;]=&amp;gt; string(1) &amp;quot;b&amp;quot; }
로그인 후 복사

常见错误 #8: 认为 PHP 支持单字符数据类型

阅读下面的代码并思考会输出什么:

for ($c = &amp;amp;#39;a&amp;amp;#39;; $c &amp;lt;= &amp;amp;#39;z&amp;amp;#39;; $c++) {
    echo $c . &amp;quot;\n&amp;quot;;
}
로그인 후 복사

如果你的答案是 az,那么你可能会对这是一个错误答案感到吃惊。

没错,它确实会输出 az,但是,它还会继续输出 aayz。我们一起来看一下这是为什么。

PHP 中没有 char 数据类型; 只能用 string 类型。记住一点,在 PHP 中增加 string 类型的 z 得到的是 aa

php&amp;gt; $c = &amp;amp;#39;z&amp;amp;#39;; echo ++$c . &amp;quot;\n&amp;quot;;
aa
로그인 후 복사

没那么令人混淆的是,aa 的字典顺序是 小于 z 的:

php&amp;gt; var_export((boolean)(&amp;amp;#39;aa&amp;amp;#39; &amp;lt; &amp;amp;#39;z&amp;amp;#39;)) . &amp;quot;\n&amp;quot;;
true
로그인 후 복사

这也是为什么上面那段简单的代码会输出 az, 然后 继续 输出 aayz。 它停在了 za,那是它遇到的第一个比 z 的:

php&amp;gt; var_export((boolean)(&amp;amp;#39;za&amp;amp;#39; &amp;lt; &amp;amp;#39;z&amp;amp;#39;)) . &amp;quot;\n&amp;quot;;
false
로그인 후 복사

事实上,在 PHP 里 有合适的 方式在循环中输出 az 的值:

for ($i = ord(&amp;amp;#39;a&amp;amp;#39;); $i &amp;lt;= ord(&amp;amp;#39;z&amp;amp;#39;); $i++) {
    echo chr($i) . &amp;quot;\n&amp;quot;;
}
로그인 후 복사

或者是这样:

$letters = range(&amp;amp;#39;a&amp;amp;#39;, &amp;amp;#39;z&amp;amp;#39;);

for ($i = 0; $i &amp;lt; count($letters); $i++) {
    echo $letters[$i] . &amp;quot;\n&amp;quot;;
}
로그인 후 복사

常见 错误 #9: 忽视代码规范

尽管忽视代码标准并不直接导致需要去调试 PHP 代码,但这可能是所有需要谈论的事情里最重要的一项。

在一个项目中忽视代码规范能够导致大量的问题。最乐观的预计,前后代码不一致(在此之前每个开发者都在“做自己的事情”)。但最差的结果,PHP 代码不能运行或者很难(有时是不可能的)去顺利通过,这对于 调试代码、提升性能、维护项目来说也是困难重重。并且这意味着降低你们团队的生产力,增加大量的额外(或者至少是本不必要的)精力消耗。

幸运的是对于 PHP 开发者来说,存在 PHP 编码标准建议(PSR),它由下面的五个标准组成:

  • PSR-0: 自动加载标准
  • PSR-1: 基础编码标准
  • PSR-2: 编码风格指导
  • PSR-3: 日志接口
  • PSR-4: 自动加载增强版

PSR 起初是由市场上最大的组织平台维护者创造的。 Zend, Drupal, Symfony, Joomla 和 其他 为这些标准做出了贡献,并一直遵守它们。甚至,多年前试图成为一个标准的 PEAR ,现在也加入到 PSR 中来。

某种意义上,你的代码标准是什么几乎是不重要的,只要你遵循一个标准并坚持下去,但一般来讲,跟随 PSR 是一个很不错的主意,除非你的项目上有其他让人难以抗拒的理由。越来越多的团队和项目正在遵从 PSR 。在这一点上,大部分的 PHP 开发者达成了共识,因此使用 PSR 代码标准,有利于使新加入团队的开发者对你的代码标准感到更加的熟悉与舒适。

常见错误 #10: 滥用 empty()

一些 PHP 开发者喜欢对几乎所有的事情使用 empty() 做布尔值检验。不过,在一些情况下,这会导致混乱。

首先,让我们回到数组和 ArrayObject 实例(和数组类似)。考虑到他们的相似性,很容易假设它们的行为是相同的。然而,事实证明这是一个危险的假设。举例,在 PHP 5.0 中:

// PHP 5.0 或后续版本:
$array = [];
var_dump(empty($array));        // 输出 bool(true)
$array = new ArrayObject();
var_dump(empty($array));        // 输出 bool(false)
// 为什么这两种方法不产生相同的输出呢?
로그인 후 복사

更糟糕的是,PHP 5.0之前的结果可能是不同的:

// PHP 5.0 之前:
$array = [];
var_dump(empty($array));        // 输出 bool(false)
$array = new ArrayObject();
var_dump(empty($array));        // 输出 bool(false)
로그인 후 복사

这种方法上的不幸是十分普遍的。比如,在 Zend Framework 2 下的 Zend\Db\TableGatewayTableGateway::select() 结果中调用 current() 时返回数据的方式,正如文档所表明的那样。开发者很容易就会变成此类数据错误的受害者。

为了避免这些问题的产生,更好的方法是使用 count() 去检验空数组结构:

// 注意这会在 PHP 的所有版本中发挥作用 (5.0 前后都是):
$array = [];
var_dump(count($array));        // 输出 int(0)
$array = new ArrayObject();
var_dump(count($array));        // 输出 int(0)
로그인 후 복사

顺便说一句, 由于 PHP 将 0 转换为 false , count() 能够被使用在 if() 条件内部去检验空数组。同样值得注意的是,在 PHP 中, count() 在数组中是常量复杂度 (O(1) 操作) ,这更清晰的表明它是正确的选择。

另一个使用 empty() 产生危险的例子是当它和魔术方法 _get() 一起使用。我们来定义两个类并使其都有一个 test 属性。

首先我们定义包含 test 公共属性的 Regular 类。

class Regular
{
    public $test = &amp;amp;#39;value&amp;amp;#39;;
}
로그인 후 복사

然后我们定义 Magic 类,这里使用魔术方法 __get() 来操作去访问它的 test 属性:

class Magic
{
    private $values = [&amp;amp;#39;test&amp;amp;#39; =&amp;gt; &amp;amp;#39;value&amp;amp;#39;];

    public function __get($key)
    {
        if (isset($this-&amp;gt;values[$key])) {
            return $this-&amp;gt;values[$key];
        }
    }
}
로그인 후 복사

好了,现在我们尝试去访问每个类中的 test 属性看看会发生什么:

$regular = new Regular();
var_dump($regular-&amp;gt;test);    // 输出 string(4) &amp;quot;value&amp;quot;
$magic = new Magic();
var_dump($magic-&amp;gt;test);      // 输出 string(4) &amp;quot;value&amp;quot;
로그인 후 복사

到目前为止还好。

但是现在当我们对其中的每一个都调用 empty() ,让我们看看会发生什么:

var_dump(empty($regular-&amp;gt;test));    // 输出 bool(false)
var_dump(empty($magic-&amp;gt;test));      // 输出 bool(true)
로그인 후 복사

咳。所以如果我们依赖 empty() ,我们很可能误认为 $magic 的属性 test 是空的,而实际上它被设置为 &amp;#39;value&amp;#39;

不幸的是,如果类使用魔术方法 __get() 来获取属性值,那么就没有万无一失的方法来检查该属性值是否为空。
在类的作用域之外,你仅仅只能检查是否将返回一个 null 值,这并不意味着没有设置相应的键,因为它实际上还可能被设置为 null

相反,如果我们试图去引用 Regular 类实例中不存在的属性,我们将得到一个类似于以下内容的通知:

Notice: Undefined property: Regular::$nonExistantTest in /path/to/test.php on line 10

Call Stack:
    0.0012     234704   1. {main}() /path/to/test.php:0
로그인 후 복사

所以这里的主要观点是 empty() 方法应该被谨慎地使用,因为如果不小心的话它可能导致混乱 -- 甚至潜在的误导 -- 结果。

요약

PHP의 사용 용이성은 개발자를 잘못된 편안함에 빠지게 만듭니다. 언어 자체의 일부 뉘앙스와 특성으로 인해 디버깅하는 데 많은 시간이 소요될 수 있습니다. 이로 인해 PHP 프로그램이 제대로 작동하지 못하고 여기에 설명된 것과 같은 문제가 발생할 수 있습니다.

PHP는 20년의 역사 동안 크게 변화했습니다. 언어 자체의 미묘함에 익숙해지는 데 시간을 투자할 가치가 있습니다. 이를 통해 작성하는 소프트웨어의 확장성, 견고성 및 유지 관리 가능성을 높이는 데 도움이 됩니다.

추천 학습: "PHP 비디오 튜토리얼"

위 내용은 PHP 프로그래머가 저지르는 10가지 흔한 실수 (공유)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
php
원천:juejin.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿