首頁 > 後端開發 > C++ > 為什麼編譯器最佳化會破壞這個 64 位元交換功能?

為什麼編譯器最佳化會破壞這個 64 位元交換功能?

DDD
發布: 2024-11-28 08:34:12
原創
584 人瀏覽過

Why Does Compiler Optimization Break This 64-bit Swap Function?

為什麼最佳化會降低這個函數的效能

在一次程式設計專業的大學講座中,一位講師提出了一個讓學生感到困惑的函數:

inline u64 Swap_64(u64 x)
{
    u64 tmp;
    (*(u32*)&tmp)       = Swap_32(*(((u32*)&x)+1));
    (*(((u32*)&tmp)+1)) = Swap_32(*(u32*) &x);

    return tmp;
}
登入後複製

最初,功能運作順利,但在啟用高最佳化等級後,它變得惰性。這種行為背後的原因在於嚴格別名規則的概念。

嚴格別名違規

提供的程式碼違反了嚴格別名規則,該規則規定物件只能是透過相容的指標類型存取。在這種情況下,u32 和 u64 指標指向可能重疊的內存,但編譯器假設它們代表不同的物件。這個假設允許它優化對臨時變數 tmp 的賦值,從而使函數無效。

為什麼會發生最佳化

允許編譯器基於假設來最佳化程式碼關於指標行為。由於 u32 和 u64 是不同的類型,編譯器假定它們不指向同一內存,並且透過 u32 指標所做的更改不會影響 tmp 的值。此優化導致了觀察到的行為。

保留函數行為的解決方案

為了防止程式碼被最佳化,指標類型應與存取的資料類型相符。一種方法是使用聯合直接存取位元:

typedef union
{
  uint32_t u32;
  uint16_t u16[2];
} U32;

uint32_t swap_words(uint32_t arg)
{
  U32 in;
  uint16_t lo;
  uint16_t hi;

  in.u32    = arg;
  hi        = in.u16[0];
  lo        = in.u16[1];
  in.u16[0] = lo;
  in.u16[1] = hi;

  return (in.u32);
}
登入後複製

透過使用聯合,我們確保指標和資料類型相容,防止編譯器最佳化預期的變更。

以上是為什麼編譯器最佳化會破壞這個 64 位元交換功能?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板