並行計算

並行計算（英語：parallel computing）一般是指許多指令得以同時進行的計算模式。在同時進行的前提下，可以將計算的過程分解成小部份，之後以並行方式來加以解決^[1]。

電腦軟體可以被分成數個運算步驟來執行。為了解決某個特定問題，軟體採用某個演算法，以一連串指令執行來完成。傳統上，這些指令都被送至單一的中央處理器，以循序方式執行完成。在這種處理方式下，單一時間中，只有單一指令被執行（processor level: 比較微處理器，CISC, 和RISC，即流水線Pipeline的概念，以及後來在Pipeline基礎上以提高指令處理效率為目的的硬件及軟件發展，比如branch-prediction, 比如forwarding，比如在每個運算單元前的指令堆棧，匯編程序員對programm code的順序改寫）。平行運算採用了多個運算單元，同時執行，以解決問題。

基本體系結構

相對於串行計算，並行計算可以劃分成時間並行和空間並行。時間並行即指令流水化，空間並行使用多個處理器執行並發計算，當前研究的主要是空間的並行問題。以程序和算法設計人員的角度看，並行計算又可分為數據並行和任務並行。數據並行把大的任務化解成若干個相同的子任務，處理起來比任務並行簡單。

空間上的並行導致兩類並行機的產生，按照麥克·弗萊因（Michael Flynn）的說法分為單指令流多數據流（SIMD）和多指令流多數據流（MIMD），而常用的串行機也稱為單指令流單數據流（SISD）。MIMD類的機器又可分為常見的五類：並行向量處理機（PVP）、對稱多處理機（SMP）、大規模並行處理機（MPP）、工作站機群（COW）、分布式共享存儲處理機（DSM）。

訪存模型

並行計算機有以下五種訪存模型：均勻訪存模型（UMA）、非均勻訪存模型（NUMA）、全高速緩存訪存模型（COMA）、一致性高速緩存非均勻存儲訪問模型（CC-NUMA）和非遠程存儲訪問模型（NORMA）。

並行計算模型

不像串行計算機那樣，主流使用馮·諾伊曼的計算模型，並行計算機沒有一個統一的計算模型。不過，人們已經提出了幾種有價值的參考模型：PRAM模型，BSP模型，LogP模型，C^3模型等。

並行計算機網絡

並行計算機是靠網絡將各個處理機或處理器連接起來的，一般來說有以下幾種方式

靜態連接：一維線性連接，網孔連接，超立方體連接，樹連接，立方環連接，洗牌交換連接，蝶形連接，金字塔連接等。
動態連接：總線連接（Bus），交叉開關（CS），多級互聯網絡（MIN）。

網絡的基本術語：

並行計算機性能度量

基本指標
加速比評測
1. Amdahl定理
2. Gustafson定理（英語：Gustafson's law）
3. Sun-Ni定理
可擴放性標準

並行算法

並行算法是一門還沒有發展成熟的學科，雖然人們已經總結出了相當多的經驗，但是遠遠不及串行算法那樣豐富。並行算法設計中最常用的的方法是PCAM方法，即劃分，通信，組合，映射。首先劃分，就是將一個問題平均劃分成若干份，並讓各個處理器去同時執行；通信階段，就是要分析執行過程中所要交換的數據和任務的協調情況，而組合則是要求將較小的問題組合到一起以提高性能和減少任務開銷，映射則是要將任務分配到每一個處理器上。總之，並行算法還需要相當多完善的地方。並行算法與串行算法最大的不同之處在於，並行算法不僅要考慮問題本身，而且還要考慮所使用的並行模型，網絡連接等等。

常見的非數值算法設計方法舉例
- 並行播送與並行求和
- 並行排序算法；
- 並行選擇算法：所謂選擇問題就是在一給定的序列中選擇出某組（個）滿足給定條件的元素。
- 關於圖論中的一些並行算法：
  - 圖論作為一門到近代才發展起來的科學。在圖論中有很多關於如何設計算法的問題，比如求最小生成樹，單源最短路徑等等。事實上，這些算法中有很多是可以並行化的，而且並行化時運用的思想具有很大的啟發性，下面是幾個常見的並行圖論算法。
- 關於串處理的並行算法：
  - KMP算法的並行化：在英特爾的開發手冊《Intel® 64 and IA-32 Architectures Optimization Reference Manual》中，「14.3.3 Substring Searches」章節內提供了KMP算法基於SIMD指令集並行的C語言實現例程，可以作為KMP算法並行化的參考範例。其中涉及到若干SIMD Intrinsics指令，比如：_mm_loadu_si128、_mm_cmpestrs、_mm_cmpestri等，其具體含義及用法可從 Intel Intrinsics Guide（ https://intel-intrinsics.com/ （頁面存檔備份，存於網際網路檔案館））在線手冊中查詢獲悉。
常見的數值算法設計方法舉例
- 並行快速傅里葉變換。

參考文獻

^ 平行計算基礎理論,系統及應用研究. 國立中正大學資訊工程研究所. 1992 [2 June 2013].

參見

計算機科學
理論計算機科學
訊息傳遞介面（Message Passing Interface － MPI）

[1] 平行計算基礎理論,系統及應用研究. 國立中正大學資訊工程研究所. 1992 [2 June 2013].

[1]

閱論編並行計算
概論	並發計算分布式計算並行計算大規模並行處理機雲端運算超級計算機高性能計算多元處理大規模多核心處理器（英語：Manycore processor） GPGPU 計算機網絡 Systolic array（英語：Systolic array）
層級	位元指令線程任務數據內存循環（英語：Loop-level parallelism）流水線
多線程	時間（英語：Temporal multithreading）同時多線程（SMT）投機（英語：Speculative multithreading）（SpMT）搶占式協作集群多線程（CMT）硬件偵測
理論	PRAM模型並行算法分析（英語：Analysis of parallel algorithms）阿姆達爾定律 Gustafson's law（英語：Gustafson's law） Cost efficiency（英語：Cost efficiency） Karp–Flatt metric（英語：Karp–Flatt metric）減速（英語：Parallel slowdown）加速比
元素	行程線程纖程指令窗口（英語：Instruction window）
協調	多元處理內存一致性（英語：Memory coherence）快取一致性高速緩存失效（英語：Cache invalidation）屏障同步應用程序檢查點（英語：Application checkpointing）
編程	串流處理數據流處理（英語：Dataflow programming）模型隱式並行（英語：Implicit parallelism）顯式並行（英語：Explicit parallelism）並發性非阻塞算法（英語：Non-blocking algorithm）
硬件	費林分類法單指令流單數據流單指令流多數據流單指令多線程（英語：Single instruction, multiple threads）（SIMT）多指令流單數據流多指令流多數據流數據流架構（英語：Dataflow architecture）指令管線化超純量並行向量處理機多處理器對稱非對稱內存共享分布式內存（英語：Distributed memory）分布式共享 UMA NUMA COMA（英語：Cache-only memory architecture）大規模並行處理機計算機集群網格計算
API	Ateji PX（英語：Ateji PX） Boost.Thread Charm++（英語：Charm%2B%2B） Cilk Coarray Fortran（英語：Coarray Fortran） CUDA Dryad（英語：Dryad (programming)） C++ AMP Global Arrays（英語：Global Arrays） MPI OpenMP OpenCL HMPP開放標準 OpenACC TPL（英語：Parallel Extensions#Task Parallel Library） PLINQ（英語：Parallel Extensions#PLINQ）並行虛擬機（英語：Parallel Virtual Machine）（PVM） POSIX線程 RaftLib（英語：RaftLib） UPC TBB（英語：Threading Building Blocks）
問題	軟件閉鎖（英語：Software lockout）可縮放性競爭危害死鎖活鎖飢餓（英語：Starvation (computer science)）確定性算法並行變慢（英語：Parallel slowdown）
分類：並行計算

閱論編計算機科學的主要領域
註：該模板大致遵循ACM 電腦分類系統。
計算機硬件	印刷電路板外部設備集成電路超大規模集成電路綠色計算電子設計自動化
系統架構組織	電腦系統架構嵌入式系統實時計算
網絡	網絡傳輸協議路由網絡拓撲網絡服務
軟件組織	直譯器中間件虛擬機器操作系統軟件質量
軟件符號和工具	編程范型編程語言編譯器領域特定語言軟體框架集成開發環境軟件配置管理函式庫
軟件開發	軟件開發過程需求分析軟件設計軟件部署軟體維護開源模式
計算理論	自動機可計算性理論計算複雜性理論量子計算數值計算方法計算機邏輯形式語義學
算法	算法分析算法設計算法效率隨機化算法計算幾何
計算數學	離散數學信息與計算科學統計學數學軟件數理邏輯集合論數論圖論類型論範疇論信息論數值分析數學分析
信息系統	數據庫管理系統電腦數據企業信息系統社會性軟件地理信息系統決策支持系統過程控制數據挖掘數位圖書館系統平台數位行銷萬維網信息檢索
安全	密碼學形式化方法入侵檢測系統網絡安全信息安全
人機交互	計算機輔助功能用戶界面可穿戴計算機普適計算虛擬現實聊天機器人
並發性	並發計算並行計算分布式計算多線程多元處理
人工智能	自動推理計算語言學計算機視覺進化計算專家系統自然語言處理機器人學
機器學習	監督式學習無監督學習強化學習交叉驗證
計算機圖形學	計算機動畫可視化渲染修飾照片圖形處理器混合現實虛擬現實圖像處理圖像壓縮實體造型
應用計算	電子商務企業級軟件計算數學計算物理學計算化學計算生物學計算社會科學醫學信息學數字藝術電子出版網絡戰電子遊戲文字處理器運籌學教育技術學生物信息學認知科學文件管理系統（英語：Document management system）
分類主題專題維基共享