少於 1 分鐘閱讀

Data-Parallel Architectures

  CPU用來處理大量資料結構與程式碼。
  為了避免停頓會使用一些技術

  • 分支預測(branch prediction)
      預測分支指令的執行路徑,減少分支錯誤導致的停頓。
  • 指令重組(instruction reordering)
      重排指令的執行順序,以最大化指令之間的並行性。
  • 動態重命名暫存器(Register renaming)
      動態重命名暫存器,避免由於名稱衝突而導致的停頓。
  • 預取指令(Cache prefetching)
      預取指令和數據到高速緩存中,減少因為緩存未命中而導致的停頓。

  GPU由大量處理器(shader cores)組合而成。GPU 可以像流水線一樣依次處理類似的數據集合以及高速並行處理,如頂點或像素。且計算是獨立進行,不需要依靠其他處理器。
  GPU 的優化是針對 吞吐量(throughput) 進行的,吞吐量被定義為數據可以被處理的最大速率。