Supercomputer

97
TRƯỜNG ĐẠI HC KHOA HC TNHIÊN KHOA CÔNG NGHTHÔNG TIN LÊ QUC ĐẠT - 1388209 SIÊU MÁY TÍNH ĐỒ ÁN MÔN KIN TRÚC MÁY TÍNH VÀ HP NGGIÁO VIÊN HƯỚNG DN THÁI HÙNG VĂN Thành phHChí Minh, năm 2014

Transcript of Supercomputer

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

KHOA CÔNG NGHỆ THÔNG TIN

LÊ QUỐC ĐẠT - 1388209

SIÊU MÁY TÍNH

ĐỒ ÁN MÔN

KIẾN TRÚC MÁY TÍNH VÀ HỢP NGỮ

GIÁO VIÊN HƯỚNG DẪN

THÁI HÙNG VĂN

Thành phố Hồ Chí Minh, năm 2014

MỤC LỤC

Mục lục

Danh mục từ viết tắt

Danh mục bảng

Danh mục hình

Danh mục phụ lục

CHƯƠNG 1 : GIỚI THIỆU SIÊU MÁY TÍNH ............................................................ 1

1.1 Các thuật ngữ liên quan đến siêu máy tính ............................................................ 1

1.2 Siêu máy tính là gì? ................................................................................................ 2

1.3 Siêu máy tính dành cho ai? .................................................................................... 3

1.4 Một siêu máy tính giá bao nhiêu? .......................................................................... 3

1.5 Siêu máy tính có thể mạnh hơn thêm bao nhiêu? .................................................. 3

1.6 "Tuổi thọ" của siêu máy tính? ................................................................................ 4

CHƯƠNG 2 : LỊCH SỬ PHÁT TRIỂN CỦA SIÊU MÁY TÍNH ................................ 5

2.1 Giai đoạn trước năm 1990...................................................................................... 5

2.2 Giai đoạn sau năm 1990 ......................................................................................... 6

CHƯƠNG 3 : KIẾN TRÚC VÀ PHẦN CỨNG SIÊU MÁY TÍNH ............................. 9

3.1 Kiến trúc ................................................................................................................. 9

3.1.1 Kiểu điện toán phân tán ................................................................................... 9

3.1.2 Kiểu điện toán tập trung ................................................................................ 10

3.2 Phần cứng ............................................................................................................. 11

3.3 Tản nhiệt, tiêu thụ năng lượng ............................................................................. 15

CHƯƠNG 4 : HỆ ĐIỀU HÀNH VÀ PHẦN MỀM .................................................... 19

4.1 Hệ điều hành ........................................................................................................ 19

4.2 Công cụ phần mềm .............................................................................................. 20

CHƯƠNG 5 : SIÊU MÁY TÍNH KIẾU PHÂN TÁN ................................................ 21

5.1 Phương pháp cơ hội - opportunistic ..................................................................... 21

5.2 Phương pháp cận cơ hội - quasi-opportunistic .................................................... 22

CHƯƠNG 6 : ĐO ĐẠC HIỆU NĂNG ........................................................................ 23

6.1 Khả năng và dung lượng ...................................................................................... 23

6.2 Đo đạc hiệu năng siêu máy tính ........................................................................... 23

6.3 Danh sách TOP500 .............................................................................................. 24

CHƯƠNG 7 : ỨNG DỤNG VÀ NHỮNG THÔNG TIN KHÁC ............................... 26

7.1 Một số ứng dụng của siêu máy tính: .................................................................... 26

7.1.1 Siêu máy tính Titan - nghiên cứu về biến đổi khí hậu và nhiên liệu thay thế

27

7.1.2 Siêu máy tính Roadrunner - mô hình hóa sự phân hủy của kho vũ khí hạt

nhân của Mỹ ............................................................................................................... 28

7.1.3 Siêu máy tính Blue Waters - vũ khí mới trong việc ngăn chặn virus HIV ... 28

7.1.4 Siêu máy tính Watson – siêu máy tính đa năng ............................................ 32

7.1.5 Siêu máy tính Stampede - mô phỏng thời tiết, mô phỏng hành vi con người,

nghiên cứu bản đồ ADN và nghiên cứu không gian .................................................. 33

7.1.6 Siêu máy tính ASTRON - xử lý dữ liệu kính thiên văn radio lớn nhất thế giới

33

7.1.7 Siêu máy tính Advanced Supercomputing HQ - dự báo thời tiết của NASA

34

7.1.8 Siêu máy tính Sequoia - mô hình quản lý vũ khí hạt nhân ........................... 35

7.1.9 Siêu máy tính Condor - phân tích và xử lý hình ảnh của không lực Italia.... 36

7.1.10 Siêu máy tính The Dawn - mô phỏng các vụ nổ hạt nhân ............................ 36

7.2 Một số hãng sản xuất và cung cấp siêu máy tính ................................................. 38

7.3 Các nước có siêu máy tính ................................................................................... 38

CHƯƠNG 8 : XU HƯỚNG NGHIÊN CỨU VÀ PHÁT TRIỂN ............................... 41

8.1 Xu hướng phát triển sức mạnh xử lý của siêu máy tính ...................................... 41

8.2 Kiến trúc mới và tiết kiệm năng lượng tiêu thụ ................................................... 41

8.2.1 Siêu máy tính nền tảng ARM ........................................................................ 42

8.2.2 Siêu máy tính The Machine .......................................................................... 43

8.2.3 Siêu máy tính quang học ............................................................................... 45

8.2.4 Siêu máy tính lượng tử .................................................................................. 46

8.3 Và sức mạnh của siêu máy tính không chỉ là tăng tốc độ xử lý .......................... 47

TÀI LIỆU THAM KHẢO ............................................................................................... 49

PHỤ LỤC ................................................................................................................ 52

DANH MỤC TỪ VIẾT TẮT

STT TỪ VIẾT TẮT TÊN ĐẦY ĐỦ

1 SMT Siêu máy tính

DANH MỤC BẢNG

Bảng 6-1 Danh sách 10 SMT mạnh nhất tháng 6/2014 .................................................... 25

Bảng 7-1 Danh sách 10 quốc gia có số lượng SMT lớn nhất tháng 6/2014 ...................... 39

DANH MỤC HÌNH

Hình 1-1 Sequoia – SMT mạnh nhất thế giới năm 2012. .................................................... 2

Hình 2-1 SMT Cray-1.......................................................................................................... 6

Hình 2-2 Biểu đồ tốc độ xử lý của siêu máy tính từ tháng 6/1993 đến tháng 6/2009 ......... 6

Hình 2-3 Biểu đồ số lượng core và tốc độ xử lý của siêu máy tính từ tháng 6/1910 đến

tháng 6/2014 ........................................................................................................................ 7

Hình 3-1 Mô hình kiểu điện toán phân tán .......................................................................... 9

Hình 3-2 Cấu trúc một hệ thống SMT kiểu điện toán tập trung ........................................ 10

Hình 3-3 Mô hình SMT dạng Massively Parallel Processors (MPP)................................ 11

Hình 3-4 Kết nối dây trong SMT Titan ............................................................................. 12

Hình 3-5 Một node của SMT Titan ................................................................................... 13

Hình 3-6 Cấu trúc của hãng Cray dùng trong Titan .......................................................... 14

Hình 3-7 Chi tiết phần cứng CPU Tegra 3 v2 GPU GeForce ........................................... 15

Hình 3-8 Cấu trúc SMT dùng CPU Tegra 3 v2 GPU GeForce ......................................... 15

Hình 3-9 Hệ thống tản nhiệt bằng nước của Titan ............................................................ 16

Hình 3-10 Mô hình SMT làm mát bằng nước ấm ............................................................. 17

Hình 4-1 Đồ thị tỉ lệ % các hệ điều hành dùng cho SMT ................................................. 19

Hình 5-1 Cấu trúc hệ thống điện toán grid kết nối với nhiều máy tính qua internet ......... 21

Hình 7-1 Ảnh mô phỏng do SMT dựng ra của Cơ quan Khí tượng và Hải dương Mỹ

(NOAA) ............................................................................................................................. 26

Hình 7-2 Cấu trúc virus HIV ............................................................................................. 29

Hình 7-3 Cấu trúc capsid của virus HIV ........................................................................... 30

Hình 7-4 Lớp vỏ capsid hình nón của virus HIV .............................................................. 31

Hình 7-5 Biểu đồ tỉ lệ % số lượng máy tính do các công ty sản xuất SMT ...................... 38

Hình 7-6 Biểu đồ tỉ lệ % số lượng SMT của các nước trên thế giới tháng 6/2014 (nguồn:

phụ lục 3) ........................................................................................................................... 39

Hình 8-1 Martin Fink, giám đốc công nghệ của HP và hình ảnh bộ vi xử lý của The

Machine ............................................................................................................................. 43

Hình 8-2 Martin Fink cùng với mô đun bộ nhớ của The Machine ................................... 44

Hình 8-3 Mô hình hiệu ứng quang học được áp dụng cho SMT trong tương lai .............. 46

DANH MỤC PHỤ LỤC

Phụ lục 1: Lịch sử phát triển của các siêu máy tính..................................................... 52

Phụ lục 2: Danh sách các siêu máy tính mạnh mẽ nhất thế giới năm 2014 ............... 64

Phụ lục 3: Danh sách các nước có siêu máy tính trong top500 tháng 6/2014 ............ 74

Phụ lục 4: Danh sách top10 siêu máy tính đứng đầu trong top500 tháng 6/2014 ..... 76

Phụ lục 5: Danh sách các siêu máy tính đứng đầu top500 từ tháng 6/1993 đến tháng

6/2014 ................................................................................................................................ 78

1

CHƯƠNG 1 : GIỚI THIỆU SIÊU MÁY TÍNH Trong thời gian gần đây chắc hẳn các bạn cũng được nghe nói nhiều về cụm từ

siêu máy tính (SMT), hay supercomputer. Đây là một loại máy tính rất khác với những

chiếc desktop, laptop mà bạn sử dụng hằng ngày. Nó có kích thước to hơn, sức mạnh

vượt trội hơn rất nhiều lần so với các máy tính cá nhân. Cũng chính vì thế mà SMT

không bao giờ được dùng để soạn văn bản, chơi game hay những ứng dụng bình thường

mà nó được dùng vào những việc như nghiên cứu khoa học, xử lí và tính toán phức tạp.

Vậy SMT là gì, cấu tạo nó ra sao và người ta dùng nó vào việc gì?

1.1 Các thuật ngữ liên quan đến siêu máy tính

Để có thể hiểu được SMT là gì và sự khác biệt giữa các SMT, trước tiên cần hiểu

rõ sự khác biệt giữa một số thuật ngữ chính bao gồm:

Hz, MHz, GHz, …: Các đơn vị tần số dùng để đo số chu kì tính toán của các thiết

bị điện tử (hay còn gọi là xung nhịp).

Máy tính có tốc độ 1 MHz tương đương với khả năng thực hiện được 1 nghìn tỷ

vòng lặp tính toán trong 1 giây. Xét trong một dòng chip thì tần số càng cao ứng với tốc

độ xử lý càng cao; tuy nhiên, khó có thể sử dụng tiêu chí này để so sánh sức mạnh của

các dòng chip khác nhau. Lý do là vì một chu kì tính toán bao gồm một số lượng phép

toán nhất định, và con số này là riêng biệt đối với từng loại chip.

Flops (Floating point operations per second), Megaflops, Gigaflops, … : Số phép

tính thực hiện được trong mỗi giây.

Máy tính có tốc độ xử lý 1 Megaflop tương đương với khả năng thực hiện 1 triệu

phép toán trên tập số thực trong 1 giây. Cũng là một đại lượng đặc trưng cho tốc độ xử

lý, nhưng Flops ưu việt hơn xung nhịp ở hai điểm:

Thứ nhất, số phép tính trên giây có thể được so sánh trực tiếp trên các loại

chip khác nhau.

2

Thứ hai, đa số các SMT sau này đều được cấu thành từ một hệ thống rất

nhiều vi xử lý; do đó, một đại lượng mang tính cộng dồn như Flops sẽ cho

kết quả chính xác hơn xung nhịp rất nhiều.

1.2 Siêu máy tính là gì?

SMT là một loại máy tính có tính năng và tốc độ xử lý siêu lớn. Bên trong SMT

là một hệ thống những máy tính mạnh làm việc song song (Thái Hùng Văn, 2014).

SMT hiện nay có tốc độ xử lý hàng ngàn teraflop (một teraflop tương đương với

hiệu suất một ngàn tỷ phép tính/giây). ( 1 pera = 1000 tera, 1 tera = 1000 giga, 1 giga =

1000 mega, 1 mega = 1000 kilo, 1 kilo = 1000).

Ví dụ như Sequoia - SMT của IBM, là một tập hợp của nhiều hệ thống Blue Gene

thế hệ thứ 3, chạy trên 1,6 triệu vi xử lý. Nó có thể đạt tốc độ xử lý tới 20 petaflop. Một

petaflop tương đương 10^15 (10 triệu tỷ) phép tính/giây, có nghĩa Sequoia có tốc độ tính

toán 20.300 (20 x 10^15) phép tính/giây.

Hình 1-1 Sequoia – SMT mạnh nhất thế giới năm 2012.

Toàn bộ SMT này cần 3.000 gallon (hơn 11.356 mét khối) nước mỗi phút để làm

mát, tiêu tốn trung bình 6 đến 7 megawatt và có khi lên tới 9,5 megawatt điện (1

megawatt tương đương 1 triệu watt điện). Chi phí cho năng lượng là rất lớn, tương đương

3

6 đến 7 triệu USD mỗi năm. 1,6 triệu nhân xử lý nằm trên 96 giá đỡ khác nhau. Mỗi giá

đỡ này nặng gần 5000 pound (khoảng 2.667 kg) và tỏa ra trung bình 100 kilowatt năng

lượng.

1.3 Siêu máy tính dành cho ai?

SMT dành cho các nhà nghiên cứu. Bản thân khái niệm về các nhà nghiên cứu

cũng khá rộng lớn và phức tạp. Công việc của họ bao gồm từ tìm cách mô phỏng các

phản ứng xảy ra trong mặt trời cho đến việc mô hình hóa các hệ thống vật lý như động

cơ máy bay, khí hậu trái đất và hệ thống mạch máu người.

Các quyết định về chính sách quan trọng, trong nhiều trường hợp, thường dựa vào

các kết quả tính toán mà các nhà nghiên cứu tìm ra, do đó, những kết quả này đồi hỏi độ

chính xác rất cao - một nhiệm vụ quả thực không hề dễ dàng. Vì vậy, SMT là một yếu

tố hỗ trợ hiệu quả cho những nghiên cứu đó.

1.4 Một siêu máy tính giá bao nhiêu?

Khoảng 6 đến 7 triệu USD chi phí cho năng lượng hàng năm, một SMT có chi

phí lắp đặt ban đầu từ 100 đến 250 triệu USD để thiết kế và lắp ráp. Đó là chưa kể đến

chi phí bảo trì chúng.

1.5 Siêu máy tính có thể mạnh hơn thêm bao nhiêu?

Liệu bạn có thắc mắc vì sao Sequoia cần tới 1,6 triệu nhân xử lý? Đó là do vi xử

lý không còn khả năng mạnh hơn được nữa. Do các định luật vật lý đã bắt đầu đi đến

giới hạn nên một trong những yếu tố giúp vi xử lý chạy nhanh hơn là tăng xung nhịp của

chúng. Tuy nhiên, chúng ta không thể tăng xung theo ý thích bởi độ nóng mà vi xử lý

tỏa ra có thể "đốt" luôn cả chiếc SMT đó. Nếu chúng ta không thể tìm cách giúp vi xử lý

nhanh hơn, đơn giản là chúng ta phải dùng đến nhiều con chip hơn. Đó là lý do các SMT

càng mạnh thì càng to lớn.

Vậy trên lý thuyết, liệu có thể tạo ra một SMT với 100 triệu nhân xử lý và tiêu

thụ 100 megawatt điện? Có lẽ là không. Đó là lý do vì sao các nhà nghiên cứu hy vọng

sẽ có những công nghệ mới giúp máy tính đạt tốc độ 10^18 phép tính/giây.

4

1.6 "Tuổi thọ" của siêu máy tính?

Không quá lâu. Trong thực tế, một SMT có "vòng đời" còn thấp hơn cả chiếc máy

Xbox 360. Các SMT thường chỉ tồn tại 2 đến 5 năm. Tác dụng của chúng thường trong

khoảng 5 năm. Sau đó, chẳng còn lý do gì mà giữ lại các SMT này do chi phí bảo trì

cũng như chi phí phải bỏ ra để đảm bảo hoạt động cho chúng là quá lớn. Sau "vòng đời"

trên cũng là lúc bắt tay xây dựng một SMT mới.

Ví dụ như chiếc siêu máy tính Roadrunner được IBM phát triển ra để mô hình

hóa sự phân hủy của kho vũ khí hạt nhân của Mỹ vào năm 2008. Tại thời điểm đó,

Roadrunner cho sức mạnh tính toán mà không có chiếc máy tính nào trên thế giới có thể

đạt tới: 1 petaflop (1 triệu tỷ phép tính mỗi giây). Với sức mạnh của mình, Roadrunner

đã giành vị trí siêu máy tính mạnh nhất thế giới ở tận 3 thời điểm: tháng 6 năm 2008,

tháng 11 năm 2008 và tháng 6 năm 2009. Tuy nhiên, sau 5 năm hoạt đông, Roadrunner

đã trở nên lỗi thời và nó đang có kế hoạch để bị phá bỏ hoàn toàn.

5

CHƯƠNG 2 : LỊCH SỬ PHÁT TRIỂN CỦA SIÊU

MÁY TÍNH

SMT đã phát triển rất mạnh mẽ trong thời gian vừa qua. Những SMT ngày nay

có thể thực hiện số phép tính mỗi giây nhiều hơn gấp hàng triệu lần so với những SMT

ở những năm 1940. Trong 25 năm trở lại đây, tốc độ và khả năng của những SMT đã

được nhân lên hàng triệu lần (phụ lục 1). Có thể chia lịch sử phát triển của SMT thành

hai giai đoạn: giai đoạn trước năm 1990 và giai đoạn sau năm 1990 đến nay.

2.1 Giai đoạn trước năm 1990

Cụm từ SMT (supercomputer) lần đầu tiên xuất hiện trong một bài báo của tờ

New York World vào năm 1929 dùng để chỉ các bảng tính khổng lồ mà IBM thiết lập ở

Đại học Columbia. Những 1960, kiến trúc SMT được một kĩ sư người Mỹ tên là Seymour

Cray làm việc cho tổ chức Control Data Corporation (CDC) thiết kế và chiếc CDC 6600

ra mắt năm 1964 được xem là supercomputer đầu tiên của thế giới. Seymour Cray được

tôn vinh là cha đẻ của SMT.

Sau đó một thời gian, Cray muốn rời CDC cùng với một số đồng nghiệp nhưng

bị CEO William Norris của công ty này từ chối vì Cray đang làm việc trên một dự án

cho Hải quân Mỹ. Mãi đến năm 1972 Cray mới thực hiện được ý định này và ông đã lập

ra công ty riêng mang tên Cray Research. Sau này Cray Research đổi tên thành Cray Inc.

và đây là một trong những hãng cung cấp SMT hàng đầu thế giới ở thời điểm hiện tại.

Tại công ty riêng của mình, năm 1976, Cray đã công bố chiếc supercomputer

Cray-1 với CPU 80MHz và nó là một trong những SMT được người ta biết đến nhiều

nhất. SMT Cray-1 với thiết kế hình trụ, đảm bảo khoảng cách giữa vi xử lí với các thành

phần khác trong hệ thống là đều nhau. Tới năm 1985, Cray-2 ra mắt với 8 vi xử lí. Hệ

thống này được làm mát bằng chất lỏng và chất flourinert do 3M sản xuất. SMT này có

tốc độ tính toán 1,9 gigaflops và nó chính là SMT nhanh nhất thế giới đến tận những

năm 1990.

6

Hình 2-1 SMT Cray-1

Với những SMT trong giai đoạn này có thể đánh giá là khả năng tính toán cũng

giống như con người.

2.2 Giai đoạn sau năm 1990

Hình 2-2 Biểu đồ tốc độ xử lý của siêu máy tính từ tháng 6/1993 đến tháng 6/2009

(nguồn: phụ lục 5)

0.00

500.00

1,000.00

1,500.00

2,000.00

2,500.00

01

/06

/19

93

01

/02

/19

94

01

/10

/19

94

01

/06

/19

95

01

/02

/19

96

01

/10

/19

96

01

/06

/19

97

01

/02

/19

98

01

/10

/19

98

01

/06

/19

99

01

/02

/20

00

01

/10

/20

00

01

/06

/20

01

01

/02

/20

02

01

/10

/20

02

01

/06

/20

03

01

/02

/20

04

01

/10

/20

04

01

/06

/20

05

01

/02

/20

06

01

/10

/20

06

01

/06

/20

07

01

/02

/20

08

01

/10

/20

08

01

/06

/20

09

Rpeak (TFlop/s)

Rpeak (TFlop/s)

7

Nếu như những chiếc SMT của năm 1980 chỉ dùng vài CPU thì đến năm 1990,

SMT đã được trang bị hàng nghìn bộ vi xử lí và chúng bắt đầu xuất hiện nhiều ở Mỹ,

Nhật. Kể từ đây, tốc độ tính toán của loại máy tính này bắt đầu tăng vọt một cách nhanh

chóng (hình 2-2). Ví dụ như chiếc SMT dùng trong hầm gió của Fujitsu sử dụng 166 vi

xử lí vector* với tốc độ 1,7 gigaflops mỗi chip vào năm 1994. Hai năm sau đó, đến lượt

máy Hitachi SR2201 với tốc độ 600 gigaflops có được nhờ 2048 bộ xử lí cũng đã làm

cho cả thế giới kinh ngạc. Intel cũng có SMT Paragon của mình với khoảng 1000 đến

4000 chip i860 và nó từng đạt danh hiệu nhanh nhất thế giới vào năm 1993.

Vi xử lí vector là CPU được tích hợp các bộ chỉ dẫn đặc biệt để có thể hoạt động

trong mảng dữ liệu 1 chiều. CPU vector có thể tăng đáng kể hiệu năng ở một số tác vụ

nhất định, đặc biệt là trong lĩnh vực giả lập số hoặc và thực thi các tác vụ giống nhau.

CPU vector phổ biến trong những năm 1970-1980 nhưng ngày nay nó đã gần như biến

mất hoàn toàn.

Hình 2-3 Biểu đồ số lượng core và tốc độ xử lý của siêu máy tính từ tháng 6/1910 đến

tháng 6/2014 (nguồn: phụ lục 5)

Trong 25 năm trở lại đây, tốc độ và khả năng của những SMT đã được nhân lên

hàng triệu lần. Trên đồ thị của hình 2-3, tốc độ xử lý tăng gần gấp đôi qua từng năm từ

năm 2010. Và để đạt được tốc độ xử lý tăng mạnh như vậy thì số lượng bộ vi xử lý được

224,162 186,368

548,352 705,024

1,572,864

560,640

3,120,000 3,120,000 3,120,000

2,331 4,701 8,774 11,280 20,133

27,113

54,902 54,902 54,902

-

10,000

20,000

30,000

40,000

50,000

60,000

2,000

502,000

1,002,000

1,502,000

2,002,000

2,502,000

3,002,000

3,502,000

01

/06

/20

10

01

/08

/20

10

01

/10

/20

10

01

/12

/20

10

01

/02

/20

11

01

/04

/20

11

01

/06

/20

11

01

/08

/20

11

01

/10

/20

11

01

/12

/20

11

01

/02

/20

12

01

/04

/20

12

01

/06

/20

12

01

/08

/20

12

01

/10

/20

12

01

/12

/20

12

01

/02

/20

13

01

/04

/20

13

01

/06

/20

13

01

/08

/20

13

01

/10

/20

13

01

/12

/20

13

01

/02

/20

14

01

/04

/20

14

01

/06

/20

14

Cores Rpeak (TFlop/s)

8

sử dụng cũng tăng với tỉ lệ tương ứng. Tuy nhiên, hiện tại, các định luật vật lý đã bắt đầu

đi đến giới hạn nên việc tăng tốc độ xử lý bằng cách tăng số lương vi xử lý không phải

là một giải pháp khả thi và hiệu quả. So với giai đoạn đầu khi SMT bắt đầu xuất hiện,

ngày nay tốc độ tính toán đã tăng lên rất nhiều. Để dễ so sánh ta sẽ xem một số so sánh

như sau:

Vào đầu những năm thập niên 60 thế kỷ 20, SMT Apollo Guidance Computer của

NASA với bộ nhớ 64 kilobyte, xung nhịp 0,043MHz trong khi con số này trên điện thoại

iPhone 5S hiện nay là 1,5 GHz.

Vào năm 1975, SMT Cray-1 được đánh giá là một SMT mạnh mẽ và có thể “bay”

với tốc độ 80MHz. Mặc dù được sử dụng chính cho mục đích nghiên cứu khoa học,

Cray-1 thực ra đã từng tham gia vào một số công đoạn hoàn thành bộ phim Tron phiên

bản đầu ra mắt năm 1982. Tuy nhiên, Cray-1 chỉ có sức mạnh đạt 80 triệu FLOPS, quá

khiêm tốn khi so sánh với con số 76,8 GFLOPS mà iPhone 5S sở hữu – tức là lớn hơn

gần một nghìn lần. Cray-2 được giới thiệu 10 năm sau Cray-1 và là chiếc máy tính nhanh

nhất thế giới cho tới năm 1990. Dẫu vậy, với con số 1,9 GFLOPS, Cray-2 vẫn xếp sau

rất nhiều so với iPhone 5S, ít nhất là với công cụ đo lường này.

Deep Blue là SMT được biết đến nhiều nhất thông qua thành tích chiến thắng vua

cờ Garry Kasparov. Deep Blue sở hữu thông số 11,38 GFLOPS đồng thời có khả năng

định vị được 200 nghìn vị trí trên bàn cờ mỗi giây. Ngày nay, tức là 17 năm sau đó, chiếc

Samsung Galaxy S5 đã được trang bị thông số GFLOPS ở mức 142 GFLOPS lớn hơn

SMT Deep Blue có được.

Đến ngày hôm nay, SMT dần xuất hiện nhiều hơn và nó cũng có mặt trên nhiều

quốc gia hơn. Hệ điều hành, kiến trúc cũng như phần cứng dùng trong SMT cũng theo

đó thay đổi rất nhiều so với vài chục năm trước.

9

CHƯƠNG 3 : KIẾN TRÚC VÀ PHẦN CỨNG SIÊU

MÁY TÍNH

3.1 Kiến trúc

Cách thức người ta thiết kế SMT đã thay đổi rất nhiều trong thời gian gần đây.

Những chiếc SMT thuở đầu của Seymour Cray hoạt động dựa trên kĩ thuật tính toán

song song và thiết kế nhỏ gọn để có thể đạt được hiệu năng tính toán cao.

Điện toán song song (parellel computing) là khái niệm dùng để chỉ việc sử dụng

một số lượng lớn CPU để thực hiện một bộ các phép tính nào đó. Tất cả các phép tính sẽ

được thực thi song song nhau. Có hai cách mà người ta thường áp dụng:

3.1.1 Kiểu điện toán phân tán

Sử dụng một mạng lưới nhiều máy tính phân tán ở nhiều nơi để xử lí số liệu (grid

computing), và phân tán ở đây có nghĩa là khoảng cách địa lý của chúng tương đối xa

nhau. Thường thì khi một chiếc máy tính trong mạng lưới được chạy lên, nó sẽ ngay lập

tức trở thành một phần của hệ thống tính toán song song, và càng nhiều máy tính tham

gia thì tốc độ xử lí sẽ nhanh hơn. Có một máy chính (Control Node) nằm ở giữa làm

nhiệm vụ điều khiển và phân bổ tác vụ cho các máy con. Có hai cách nhỏ thuộc dạng

này, chúng ta sẽ tìm hiểu thêm ở chương 5.

Hình 3-1 Mô hình kiểu điện toán phân tán

10

3.1.2 Kiểu điện toán tập trung

Sử dụng một lượng lớn CPU đặt gần nhau, và người ta gọi đây là computer cluster

và đây là kiểu điện toán tập trung. Những CPU này thường nằm trong nhiều máy tính

giống nhau, lân cận nhau (gọi là các node, node card hay computer node) và chúng được

kết nối nhằm tạo ra một hệ thống lớn hơn, hoàn chỉnh hơn. Người ta xem cả hệ thống

như một SMT duy nhất. Với biện pháp này, các nhà thiết kế cần đảm bảo rằng tốc độ

cũng như tính linh hoạt nội liên kết giữa các máy tính phải đủ đáp ứng yêu cầu công việc.

Theo số liệu từ TOP500, số SMT cluster hiện chiếm đến 82,2% thị phần SMT toàn cầu.

SMT IBM Blue Gene/Q sử dụng dạng cluster.

Từ các vi xử lí, các nhà sản xuất/cung ứng SMT sẽ tích hợp nó lên một chiếc

"computer card" với RAM và có thể có thêm nhiều linh kiện khác để tạo ra một chiếc

máy tính gần hoàn chỉnh. Nhiều computer card gắn vào một khay, sau đó các khay lại

tiếp được bỏ trong những tủ chứa (rack). Nhiều rack sẽ cấu thành một hệ thống SMT

hoàn chỉnh.

Hình 3-2 Cấu trúc một hệ thống SMT kiểu điện toán tập trung

11

Ngoài ra còn có SMT dạng Massively Parallel Processors (MPP), tức là một máy

tính bự nhưng có hàng nghìn CPU và thanh RAM trong đó. Chúng được nối với nhau

theo một chuẩn mạng đặc biệt tốc độ siêu cao chứ không xài các thứ phổ thông như

cluster. Ngoài ra, mỗi CPU sẽ có bộ nhớ riêng của nó và một bản sao hệ điều hành/ứng

dụng riêng. MPP hiện chiếm 17,8% thị phần SMT, theo TOP500. SMT IBM Blue

Gene/L (đứng thứ 5 thế giới vào năm 2009) được thiết kế dạng MPP.

Hình 3-3 Mô hình SMT dạng Massively Parallel Processors (MPP)

3.2 Phần cứng

Như đã nói ở trên, vào những năm 1970 thì SMT chỉ dùng một số ít bộ xử lý mà

thôi. Nhưng đến những năm 1990, số CPU của nó đã lên đến hàng nghìn và ở thời điểm

hiện tại, số CPU vài triệu là chuyện hết sức bình thường đối với một SMT.

Ở các SMT dạng cluster, người ta thường ghép nhiều "nút" (node) nhỏ lại với

nhau để tạo ra một hệ thống lớn như hình bạn đã thấy ở ngay bên trên. Mỗi một nút như

thế có thể xem là một chiếc máy tính gần như hoàn chỉnh với một hoặc nhiều CPU, GPU,

nhiều thanh RAM, quạt tản nhiệt và một số thành phần khác nữa. Các nút sẽ được kết

nối với nhau theo nhiều cách, có thể là dùng cáp đồng bình thường, cũng có thể là chuyển

sang dùng cáp quang để đảm bảo băng thông tốt hơn. Sức mạnh của SMT sẽ là sức mạnh

tổng hợp từ tất cả các node lại với nhau.

12

Hình 3-4 Kết nối dây trong SMT Titan

Trong các hệ thống SMT, người ta cũng cần đến ổ lưu trữ, và các ổ HDD, SSD

này không nằm trong máy (device attached storage - DAS) như trên PC. Thay vào đó,

chúng thường được bố trí trong một tủ riêng (storage area network - SAN), có kết nối

mạng riêng và dung lượng cũng rất "khủng".

Giờ đây, ngoài CPU đơn thuần, người ta còn sử dụng thêm các GPGPU (general

purpose graphic processor unit) để tăng cường sức mạnh cho SMT. Từ trước đến nay

chúng ta biết GPU được sử dụng để dựng hình ảnh, xử lí những thứ liên quan đến đồ

họa, nhưng ngoài ra chúng còn có thể xử lí số liệu và làm một số công việc tương tự như

CPU. Hiện nay giá thành của các GPGPU đã giảm, hiệu suất lại tăng cao nên ngày càng

nhiều SMT "nhờ vả" vào linh kiện này để tăng sức mạnh nhưng vẫn đảm bảo chi phí

không bị đội lên quá nhiều. SMT mạnh nhất thế giới (tính đến 23/5/2013) mang tên Titan

đặt ở Mỹ cũng dùng 18.688 GPU NVIDIA Tesla K20 bên cạnh 18.688 CPU AMD

Opteron 16 nhân, như vậy tổng số nhân CPU của máy là 299.008, một con số khổng lồ

so với máy tính chỉ 2 hay 4 nhân.

13

Hình 3-5 Một node của SMT Titan

Một node của SMT Titan có 4 CPU AMD Opteron 16 nhân và 4 GPU NVIDIA

Tesla K20 (kiến trúc xây dựng là Kepler). RAM mỗi node là 32GB, cộng với 6GB bộ

nhớ GDDR5 của card đồ họa nữa. Tổng cộng có 710 Terabyte bộ nhớ trong Titan.

Thực chất việc sử dụng GPGPU để tăng cường cho CPU vẫn còn là một vấn đề

đang được các nhà khoa học bàn cãi. Nhiều người cho rằng việc bổ sung GPGPU đúng

là có giúp SMT trở nên mạnh hơn và ghi được điểm benchmark cao hơn, tuy nhiên khi

đưa vào thực tế thì người ta phải bỏ rất rất nhiều công sức tính chỉnh phần mềm để có

thể vắt sạch sức mạnh của kiến trúc kết hợp này.

14

Hình 3-6 Cấu trúc của hãng Cray dùng trong Titan

Cấu trúc của hãng Cray dùng trong Titan là sự kết hợp của cả hai loại Cray XK6

và XE6, trong đó XK6 có hai card NVIDIA đi kèm với RAM bên cạnh CPU AMD

Opteron 64

Châu Âu cũng đang phát triển một dự án SMT dùng CPU Tegra 3 v2 GPU

GeForce. Cụ thể, SMT này xử dụng 256 bộ vi xử lí bốn nhân NVIDIA Tegra 3, 256 bộ

xử lí đồ họa GeForce 520MX và 1TB bộ nhớ RAM DDR3 để hoạt động. Với cấu hình

như thế này, máy có thể tính được 38 teraflops trong một giây nhưng chỉ tốn 1W điện

cho mỗi 7,5 gigaflops. NVIDIA gọi đây là SMT đầu tiên sử dụng CPU của ARM kết

hợp với GPU của hãng. Dự án nghiên cứu, hợp tác xây dựng SMT ở Châu Âu mang tên

Mont-Blanc hứa hẹn sản phẩm này sẽ hoạt động với hiệu suất cao hơn từ bốn đến mười

lần các đối thủ SMT khác vào năm 2014.

15

Hình 3-7 Chi tiết phần cứng CPU Tegra 3 v2 GPU GeForce

Hình 3-8 Cấu trúc SMT dùng CPU Tegra 3 v2 GPU GeForce

3.3 Tản nhiệt, tiêu thụ năng lượng

Qua nhiều thập kỉ, một trong những vấn đề chính với SMT dạng tập trung đó là

việc tiêu thụ năng lượng và tản nhiệt. Mỗi một chiếc SMT ăn một lượng điển khổng lồ,

và phần lớn trong số đó bị chuyển hóa thành nhiệt năng. Khi hệ thống bị quá nhiệt có thể

khiến hiệu suất giảm đi trầm trọng, tuổi thọ các linh kiện cũng bị rút ngắn đáng kể. Các

nhà khoa học đã nghiên cứu nhiều phương án để giải quyết vấn đề này, chẳng hạn như

bơm chất làm mát Flourinert, làm mát bằng chất lỏng, bằng không khí, bằng hệ thống lai

giữa chất lỏng với không khí. Đặc biệt hệ thống lai này được sử dụng phổ biến trong các

SMT được cấu thành từ nhiều tủ chứa. Ngoài ra, một số SMT còn sử dụng vi xử lí năng

lượng thấp để đương đầu với vấn đề nhiệt độ cao như chiếc Blue Gene của IBM. Chiếc

16

IBM Aquasar còn đặc biệt hơn nữa khi nó sử dụng nước nóng để tản nhiệt và dòng nước

đó cũng được dùng để làm ấm cho cả tòa nhà trong mùa lạnh.

SMT Blue Gene của IBM có thể tính toán được 2.10^15 phép tính trong một giây,

tức 2 gigaflop/s trên mỗi Watt điện. Khi mẫu thử Mont-Blanc được hoàn thiện thì nó có

thể đạt mức 7 gigaflop/s trên mỗi Watt, gấp hơn hai lần Blue Gene, và sử dụng khoảng

2.000 - 4.000 bộ xử lí. Thay vì dùng ít vi xử lí nhưng mỗi đơn vị tiêu thụ điện năng quá

lớn, các nhà khoa học sẽ dùng rất nhiều những vi xử lí nhỏ nhưng mức độ tiêu thụ chỉ là

trung bình.

Nếu làm một phép so sánh nhỏ thì chip Tegra 3 có mức tiêu thụ điện vào khoảng

4W, trong khi các CPu Intel Xeon có thể dễ dàng "đốt" 50W đến 100W trong lúc nó hoạt

động. Phần mềm sẽ phải được viết lại để SMT hoạt động được trên GPU mới cũng như

CPU Tegra 3. NVIDIA đã ra mắt một bộ phát triển để những nhà lập trình viết phần

mềm cho SMT của sử dụng các sản phẩm của họ.Thú vị hơn đó là NVIDIA đã bắt đầu

sản xuất những con chip thế hệ kế tiếp của Tegra 3, bao gồm một bộ xử lí 64-bit dựa trên

nhân ARM Cortext A15. Chúng sẽ giúp các SMT hoạt động mạnh mẽ hơn, tính toán

nhanh hơn 4 lần nhưng vẫn tiêu thụ 4W điện cho mỗi CPU.

Hình 3-9 Hệ thống tản nhiệt bằng nước của Titan

17

Nói thêm về lượng điện sử dụng bởi supercomputer, chúng ta có thể lấy dí dụ như

chiếc Tianhe-1A của Trung Quốc có công suất 4,04 megawatt, tức là cơ quan chủ quản

phải chi ra 400 USD/giờ cho tiện điện và tính cả năm là 3,5 triệu USD. Do đó, vấn đề

chi phí khi vận hàng SMT cũng là một bài toán phức tạp.

Để đo hiệu suất sử dụng năng lượng của SMT, người ta sử dụng con số FLOPS

trên Watt và chỉ số này càng cao càng tốt, tức là với mỗi Watt điện thì SMT tính toán

được nhiều phép tính hơn. Năm 2008, chiếc Roadrunner của IBM đạt 376 MFLOPS/W.

Năm 2010, chiếc Blue Gene/Q đạt 1684 MFLOPS/W. Năm 2011, chiếc Blue Gene đặt

tại New York thì đạt 2097 MFLOPS/W.

Và các hang sản xuất SMT đã có nhiều giải pháp để giải quyết vấn đề tiêu thụ

năng lượng và tản nhiệt. Như là IBM áp dụng cho chiếc SMT đầu tiên của hãng có hệ

thống làm mát bằng nước ấm, được lắp đặt tại Viện kỹ thuật liên bang Thụy Sĩ (ETH

Zurich). Có tên là Aquasar, hệ thống này không chỉ tiêu thụ ít năng lượng hơn 40% so

với những máy làm mát bằng không khí, mà nó còn giúp giảm 85% lượng khí thải CO2

khi sử dụng lượng nhiệt thải ra từ máy tính để làm nóng hệ thống sửa ấm của tòa nhà.

Một bộ khung chứa SMT sẽ được làm mát bằng không khí để có thể so sánh trực

tiếp. Bộ khung còn lại sẽ được làm mát bằng các ống chất lỏng lắp đặt trực tiếp trên các

bộ xử lý và một số bộ phận khác bên trong SMT sẽ được làm mát bằng nước ấm (nhiệt

độ nước lên khoảng 60 độ C).

Hình 3-10 Mô hình SMT làm mát bằng nước ấm

18

Nước ấm cho phép các bộ xử lý hoạt động tốt bên dưới ngưỡng nhiệt độ tối đa và

chất làm mát sẽ giúp tản nhiệt hiệu quả hơn gấp 4.000 lần so với hệ thống làm mát bằng

không khí, lượng nhiệt thải ra từ hệ thống SMT sẽ được chuyển sang hệ thống sửa ấm

của tòa nhà. Hệ thống Aquasar đã đóng góp một phần quan trọng trong việc phát triển

các hệ thống SMT hiệu năng cao. Trong tương lai, hiệu quả của một hệ thống máy tính

có thể sẽ được đo bằng mức năng lượng tiêu thụ và lượng khí CO2 mà nó thải ra.

Khi kiểm tra bằng hệ thống benchmark LINPACK, Aquasar đạt mức hiệu năng

là 6 teraflops và mức tiêu hao năng lượng vào khoảng 450megaflops/watt, trong khi vẫn

còn 9 kilowatt nhiệt năng được cung cấp cho hệ thống sưởi của tòa nhà.

19

CHƯƠNG 4 : HỆ ĐIỀU HÀNH VÀ PHẦN MỀM

4.1 Hệ điều hành

Từ đầu thế kỉ 20, hệ điều hành sử dụng trong SMT cũng đã ghi nhận nhiều sự

chuyển biến, tương tự như cách mà kiến trúc supercomputer thay đổi. Những OS đầu

tiên được tùy chỉnh cho từng SMT một để tăng tốc độ, tuy nhiên điều đó rất tốn thời gian,

công sức và tiền bạc. Do đó, trong xu hướng hiện nay, người ra sẽ dùng những OS chung

như Linux cho SMT chứ không còn xài UNIX như những năm 90 nữa. Chúng ta có thể

nhìn vào biểu đồ ngay bên dưới là thấy ngay xu hướng chuyển dịch này.

Hình 4-1 Đồ thị tỉ lệ % các hệ điều hành dùng cho SMT

Trong số 500 SMT nhanh nhất thế giới, Linux là hệ điều hành chiếm số lượng lớn

nhất và việc áp dụng OS nguồn mở này ngày càng được ưa chuộng. Linux đang chiếm

đến 93,8% thị phần SMT. UNIX cũng là hệ điều hành được sử dụng trên nhiều SMT

20

nhưng không phổ biến như Linux và nó đang nắm trong tay 4% thị phần. Windows và

BSD cũng có mặt, tuy nhiên số lượng không đáng kể bởi chúng không đáng tin cậy như

Linux và UNIX, ngoài ra còn có ảnh hưởng bởi chi phí bản quyền nữa. OS X của Apple

trước đây từng được dùng cho SMT nhưng chủ yếu là trong các supercomputer dạng

phân tán.

4.2 Công cụ phần mềm

Vì kiến trúc tính toán song song của SMT, người ta thường phải áp dụng các kĩ

thuật lập trình đặc biệt để khai thác hết sức mạnh của nó. Những công cụ dùng cho việc

này là các hàm API như MPI, PVM, VTL, ngoài ra còn có các giải pháp phần mềm

nguồn mở như EBowulf. Trong hầu hết các trường hợp, môi trường PVM và MPI sẽ

dùng cho các hệ thống dạng cluster, còn OpenMP dùng cho hệ thống có bộ nhớ chia sẻ.

Các thuật toán cũng cần được tối ưu hóa rất nhiều bởi vì SMT không chỉ chạy trên một

mà trên rất rất nhiều CPU, GPU, chưa kể là từng tủ SMT lại nằm riêng với nhau. Các

nhà khoa học cũng phải tính tới việc giảm thiểu đến mức thấp nhất có thể thời gian rỗi

của CPU khi đợi dữ liệu từ node khác chuyển sang. Với các SMT dùng GPGPU, người

ta có thêm các mô hình CUDA của NVIDIA để tăng cường hiệu suất máy.

21

CHƯƠNG 5 : SIÊU MÁY TÍNH KIẾU PHÂN TÁN

Ở dạng phân tán, có hai cách thức để tận dụng nhiều máy tính nhỏ, đó là phương

pháp cơ hội (opportunistic) và phương pháp cận cơ hội (quasi-opportunistic).

5.1 Phương pháp cơ hội - opportunistic

Đây là một dạng của điện toán grid. Trong phương pháp này, một số lượng lớn

máy tính riêng lẻ sẽ tình nguyện phối hợp cùng nhau thành một mạng lưới lớn để thực

thi các tác vụ tính toán cũng khổng lồ không kém. Grid computing đã từng giải quyết

được nhiều vấn đề cần đến điện toán song song, nhưng nó cũng có hạn chế là không tính

được một số tác vụ cổ điển như mô phỏng dòng chảy.

Hình 5-1 Cấu trúc hệ thống điện toán grid kết nối với nhiều máy tính qua internet

Mạng lưới SMT nhanh nhất tính đến tháng 3/2012 đó là Folding@Home (do đại

học Standford phát triển). Nó có sức mạnh 8,1 petaflops và sử dụng các vi xử lí x86.

Trong số đó, 5,8 petaflops được "cống hiến" từ các máy tính với nhiều loại GPU khác

nhau, 1,7 petaflops thì đến từ các máy chơi game PlayStation 3, số còn lại là do nhiều

CPU đóng góp. Hồi năm 2011, thế giới có grid BOINC với sức mạnh 5,5 petaflops góp

từ 480.000 máy tính. Còn trong năm ngoái, Simon Cox đã làm ra một chiếc SMT với 64

chiếc Raspberry Pi's. Hệ thống này mang tên Iridis-Pi và có chi phí chỉ 2500 Bảng Anh

và có bộ nhớ 1TB (16GB thẻ SD cho mỗi chiếc Raspberry Pi).

22

5.2 Phương pháp cận cơ hội - quasi-opportunistic

Điện toán quasi-opportunistic cũng tương tự như điện toán opportunistic, tuy

nhiên nó có chất lượng dịch vụ cao hơn nhờ việc tăng cường kiểm soát các tác vụ mà

mỗi máy đơn lẻ sẽ làm. Nó cũng điều khiển chặt chẽ quá trình sử dụng tài nguyên phân

tán. Kèm theo đó còn có một hệ thống thông minh giúp đảm bảo mức độ hiện diện cũng

như mức độ ổn định của các máy thành viên. Để phương pháp cận cơ hội phát huy hiệu

quả, các máy tính sẽ cần phải có một "hợp đồng phân bổ tài nguyên" kết hợp với nhiều

hình thức liên lạc, chống lỗi phức tạp.

23

CHƯƠNG 6 : ĐO ĐẠC HIỆU NĂNG

6.1 Khả năng và dung lượng

SMT được thiết kế để nhắm việc tính toán các phép tính phức tạp, tức là capability

computing. Điều này có nghĩa là SMT được sử dụng để đưa khả năng tính toán lên mức

tối đa, từ đó giải quyết một vấn đề trong thời gian ngắn nhất có thể. Các phép tính này

rất đặc biệt và nó khó đến nỗi những máy tính bình thường không thể đảm đương được,

ví dụ mô phỏng vụ nổ hạt nhân, dự báo thời tiết, nghiên cứu lượng tử...

Còn nếu muốn xử lí một dung lượng lớn dữ liệu, người ta không dùng SMT mà

dùng một loại máy tính gọi là mainframe. Mainframe có thể đảm nhận được dữ liệu đầu

vào khổng lồ nhưng các phép tính mà nó chạy không phức tạp như SMT. Mainframe chỉ

có thể dùng để giải quyết nhiều vấn đề nhỏ cùng lúc.

6.2 Đo đạc hiệu năng siêu máy tính

Nếu như ở PC, laptop, tablet, smartphone người ta sẽ tiến hành benchmark để biết

được sức mạnh của máy thì trên SMT cũng y như thế. Tuy nhiên, khả năng tính toán của

SMT được đo bằng FLOPS (FLoating Point Operations Per Second - phép tính dấu chấm

động thực hiện trong mỗi giây), trong khi máy tính bình thường thì đo bằng MIPS

(instructions per second - số chỉ dẫn được thực hiện trong mỗi giây). FLOPS có thể được

thêm một số tiếp đầu ngữ trong hệ đo lường SI như tera- (TFLOPS, tức 10^12 FLOPS,

đọc là teraflops), peta (10^15 FLOPS).

Hiện nay các SMT hàng đầu thế giới đều đã bước sang ngưỡng Petaflops, ví dụ

như chiếc IBM Roadrunner năm 2008 là 1,105 Petaflops, Fujitsu K năm 2011 đạt mức

10,51 Petaflops, còn chiếc Cray Titan mạnh nhất hiện nay là 17.59 Petaflops. Người ta

dự đoán là chỉ sau khoảng 10 năm nữa, SMT sẽ sớm bước sang hàng Exaflops (10^18

FLOPS) vì công nghệ của CPU và GPGPU đang tăng trưởng vượt bậc, giá thành lại rẻ

đi và hiệu năng tiêu thụ điện ngày càng được nâng cao.

24

Vậy những con số FLOPS ở đâu ra? Nó được đo bằng một phần mềm tên là

Linpack. Tuy nhiên cũng cần phải nói thêm rằng không một con số đứng riêng lẻ nào có

thể phản ánh toàn bộ hiệu năng của máy tính nói chung và SMT nói riêng. Có hai con số

được thể hiện khi nói tới SMT: hiệu năng tính toán dấu chấm động lý thuyết của vi xử lí

(kí hiệu Rpeak) và hiệu năng xử lí đầu vào (Rmax). Rpeak gần như không thể nào đạt

được trong đời thực, trong khi Rmax là hoàn toàn có thể đạt đến khi SMT chạy. Tất cả

những con số FLOPS bạn thấy ở trên đều là Rmax.

6.3 Danh sách TOP500

Kể từ năm 1993, những SMT nhanh nhất thế giới được liệt kê vào một danh sách

gọi là TOP500 dựa theo điểm số benchmark của nó. TOP500 có trang web riêng của họ

ở địa chỉ http://top500.org và nó cung cấp cho chúng ta rất nhiều thông tin hữu ích. Bên

cạnh việc xem danh sách những SMT hàng đầu thế giới, bạn có thể xem thống kê về việc

phân bổ hệ điều hành trong thế giới SMT như thế nào, số lượng SMT mỗi nước, kiến

trúc SMT (MPP hay cluster)…

Tuy nhiên, vẫn có những quan điểm không đồng ý với cách xếp hạng trên. Ví dụ

như những nhà khoa học ở Đại học Illinois bày tỏ quan ngại rằng công cụ Linpack dùng

để chấm điểm TOP500 không thật sự phản ánh hiệu năng thực tế của SMT, do đó họ

không nộp hồ sơ để đưa của SMT Blue Waters của họ vào TOP500.

Vì vậy danh sách này không hề được đánh giá là chính xác tuyệt đối và không

thiên vị, tuy nhiên nó là một trong những nguồn phổ biến nhất mà người ta thường lấy

khi so sánh sức mạnh SMT ở một thời điểm nào đó.

Thứ

hạng Tên hệ thống Số nhân

Rmax

(TFlop/s)

Rpeak

(TFlop/s)

Công

suất

(kW)

1 Tianhe-2 (MilkyWay-2) 3,120,000 33,862.70 54,902.40 17,808

2 Titan 560,640 17,590.00 27,112.50 8,209

3 Sequoia 1,572,864 17,173.20 20,132.70 7,890

4 K computer 705,024 10,510.00 11,280.40 12,660

5 Mira 786,432 8,586.60 10,066.30 3,945

25

6 Stampede 462,462 5,168.10 8,520.10 4,510

7 JUQUEEN 458,752 5,008.90 5,872.00 2,301

8 Vulcan 393,216 4,293.30 5,033.20 1,972

9 SuperMUC 147,456 2,897.00 3,185.10 3,423

10 Tianhe-1A 186,368 2,566.00 4,701.00 4,040

Bảng 6-1 Danh sách 10 SMT mạnh nhất tháng 6/2014 (nguồn: phụ lục 2)

Trong danh sách TOP500 phiên bản thứ 41 tháng 6 năm 2014, SMT Tianhe-2

(còn gọi là Milky Way-2) của Trung Quốc hiện là SMT mạnh nhất thế giới (phụ lục 4).

Tianhe-2 đã chiếm lấy vị trí dẫn đầu của SMT Titan do Mỹ phát triển theo danh sách

công bố hồi tháng 11 năm 2013. Máy được trang bị 32.000 vi xử lí Intel Xeon E5-2600

v2 dựa trên kiến trúc Ivy Bridge) đi kèm với 48.000 coprocessor Xeon Phi. Cấu hình này

giúp Tianhe-2 có khả năng tính toán với tốc độ 33,85 petaflops, cao gấp đôi so với Titan.

Tianhe-2 không những là SMT mạnh nhất trong TOP500 mà nó còn là một trong

những hệ thống có hiệu suất sử dụng năng lượng tốt nhất với tổng công suất 17,8

megawatt. Tianhe-2 được sử dụng "kiến trúc tân hỗn tạp", trong đó nhiều phần cứng với

các khả năng tính toán khác nhau được truy cập bởi một mô hình lập trình chung. Điều

này giúp đơn giản hóa công đoạn phát triển và tối ưu hóa hệ thống, một lợi thế không có

được với các siêu máy tính sử dụng CPU kết hợp với GPU (như Titan chẳng hạn).

26

CHƯƠNG 7 : ỨNG DỤNG VÀ NHỮNG THÔNG

TIN KHÁC

7.1 Một số ứng dụng của siêu máy tính:

Những ứng dụng của các SMT hàng đầu trên thế giới thường là rất nhạy cảm và

được giữ bí mật trước công chúng vì vậy thông tin về các ứng dụng của SMT rất hạn

chế. Bốn nhóm ứng dụng chính của SMT thường được sử dụng trên thế giới là: vũ khí

hạt nhân, năng lượng, quân sự và những hệ thống máy móc lớn.

Hình 7-1 Ảnh mô phỏng do SMT dựng ra của Cơ quan Khí tượng và Hải dương Mỹ

(NOAA)

Bên cạnh đó, SMT còn được sử dụng để giúp chúng ta thực hiện nhiều công việc

tưởng chừng như không thực hiện được như:

Dự báo thời tiết, nghiên cứu khí động học, nghiên cứu sự biến đổi khí hậu,

mô phỏng động đất

Phân tích xác suất, dựng mô hình phóng xạ, mô phỏng vụ nổ hạt nhân trong

không gian 3D

27

Lượng tử học, phân tử học, sinh học tế bào, nghiên cứu sự gấp khúc của

protein, dựng mô hình lây lan của dịch bệnh

Nghiên cứu và dựng mô hình của các hiện tượng vật lý

Mô phỏng não người, nghiên cứu và mô phỏng trí tuệ nhân tạo

Nghiên cứu thiên văn học, tái tạo vụ nổ Bigbang (do SMT ở trung tâm

Texas Advanced Computing Center thực hiện), nghiên cứu về vật chất tối

Chơi cờ vua! (SMT Deep Blue của IBM từng đánh bại đại kiện tướng

Garry Kasparov vào năm 1997)

Và dưới đây là những ứng dụng cụ thể của các SMT trên thế giới hiện nay:

7.1.1 Siêu máy tính Titan - nghiên cứu về biến đổi khí hậu và nhiên liệu thay thế

Titan là phiên bản nâng cấp từ Jaguar (ra mắt năm 2009 và là SMT mạnh nhất thế

giới ở thời điểm đó). Nhiệm vụ của Titan là phục vụ các nhà nghiên cứu từ các học viện,

phòng thí nghiệm của chính phủ, và các ngành công nghiệp khác nhau để nghiên cứu

những vấn đề như biến đổi khí hậu và các nhiên liệu thay thế. Theo các nhà khoa học,

dự báo về thời tiết có thể chính xác hơn rất nhiều với sự giúp đỡ của SMT Titan.

Hiện tại, có sáu lĩnh vực chủ yếu được nhắm tới để khai thác sức mạnh Titan phục

vụ công tác nghiên cứu:

• Khoa học vật liệu: Chủ yếu để tìm kiếm vật liệu ở cấp độ nguyên tử, hiểu các

thuộc tính của nó. Nó cũng liên quan đến việc tìm ra cách để xây dựng các vật liệu mới

có các đặc tính vượt trội.

• Biến đổi khí hậu: Các nhà nghiên cứu muốn trả lời các câu hỏi về những gì đang

xảy ra, làm thế nào để thay đổi và thích ứng với biến đổi khí hậu.

• Nhiên liệu sinh học: Điều này liên quan đến việc tìm kiếm các loại thực vật,

chẳng hạn như biến một loại cỏ thành ethanol nhờ chất xúc tác enzym (chất xúc tác sinh

học đặc biệt có thành phần cơ bản là protein).

• Năng lượng hạt nhân: Công nghệ này có thể được sử dụng để kích thích lượng

nơtron trong phản ứng tổng hợp và phản ứng phân hạch. Nó cũng bao gồm những dạng

28

năng lượng an toàn hơn và sạch hơn, cũng như nhiên liệu mới sẽ đốt cháy lâu hơn và

sạch hơn.

• Chất đốt: Titan có thể cho phép mô phỏng các quá trình đốt cháy giúp các nhà

nghiên cứu tối ưu hóa nhiên liệu, quy trình và thiết kế động cơ để có được nhiên liệu

cháy sạch hơn.

• Vật lý thiên văn

7.1.2 Siêu máy tính Roadrunner - mô hình hóa sự phân hủy của kho vũ khí hạt

nhân của Mỹ

Năm 2008, chiếc SMT Roadrunner được IBM phát triển ra để mô hình hóa sự

phân hủy của kho vũ khí hạt nhân của Mỹ. Trong suốt 5 năm hoạt động, Roadrunner là

một phần của Cục An ninh hạt nhân quốc gia, đóng vai trò quan trọng trong chương trình

Stockpile Stewardship (một chương trình về nghiên cứu kho hạt nhân). Roadrunner là

một hệ thống mạnh mẽ, đảm nhiệm các công việc tính toán về ngăn chặn hạt nhân, đồng

thời đóng vai trò quan trọng trong các chương trình khoa học khác.

7.1.3 Siêu máy tính Blue Waters - vũ khí mới trong việc ngăn chặn virus HIV

Hiện nay, phương pháp để vô hiệu hóa hoàn toàn virus HIV cũng như loại bỏ khả

năng kháng thuốc của nó vẫn là một câu trả lời khó đối với các nhà khoa học. Giờ đây

chúng ta hầu như đã nắm được mối nguy hiểm của loại virus chưa có thuốc chữa này.

HIV lây nhiễm vào các tế bào quan trọng trong hệ thống miễn dịch của con người như

lympho bào T có tính bổ trợ (cụ thể là những tế bào T - CD4+), đại thực bào và tế bào

tua. Nhiễm HIV làm giảm mạnh số lượng tế bào CD4+ thông qua 3 cơ chế chính: đầu

tiên, virus trực tiếp giết chết các tế bào mà chúng nhiễm vào, sau đó làm tăng tỷ lệ chết

rụng tế bào ở những tế bào bị nhiễm bệnh, bước 3 là các lympho bào T độc (CD8) giết

chết những lympho bào T - CD4+ bị nhiễm bệnh. Khi số lượng các tế bào CD4+ giảm

xuống dưới một mức giới hạn nào đó, sự miễn dịch qua trung gian tế bào bị vô hiệu và

cơ thể dần dần yếu đi tạo điều kiện cho các nhiễm trùng cơ hội. Nhưng nhờ những nỗ

lực của các nhà nghiên cứu tới từ Đại học Pittsburgh, Đại học Illinois và sự hỗ trợ của

29

SMT Blue Waters, chúng ta đã thu được những thành quả nhất định trên con đường ngăn

chặn tận gốc sự phát triển của loại virus nguy hiểm này.

HIV có cấu trúc không giống với các retrovirus khác. Nó có hình cầu với đường

kính khoảng 120 nm, nhỏ hơn khoảng 60 lần so với một tế bào hồng cầu, nhưng đối với

các virus khác thì nó khá lớn. HIV chứa 2 bản sao của ARN chuỗi đơn dương mã hóa 9

gen của virus được bao bọc bởi 1 lớp vỏ (capsid) hình nón bao gồm 2.000 bản sao của

các protein p24. Các RNA sợi đơn được gắn kết với những protein nucleocapsid p7 (phức

hợp bao gồm acid nucleic và vỏ capsid) và những enzyme cần thiết cho sự phát triển của

virus như enzyme phiên mã ngược, enzyme protease, ribonuclease và integrase. Capsid

có trách nhiệm bảo vệ RNA và vô hiệu hóa hệ thống miễn dịch của vật chủ, đồng thời

đưa nó thâm nhập vào tế bào của con người. Một khi lọt vào được bên trong tế bào cơ

thể người, capsid sẽ phân chia để giải phóng các thành phần, giúp virus tái tạo. Nói cách

khác capsid chính là “điểm then chốt” nhằm tìm ra phương thuốc hữu hiệu tận diệt virus

HIV.

Hình 7-2 Cấu trúc virus HIV

30

Cấu trúc virus HIV bao ngoài là một lớp màng lipid kép, dưới màng có gai là các

glycoprotein trọng lượng phân tử 120 kilođanton (KD) ký hiệu là gp120, vỏ protein có

dạng hình cầu gồm các phân tử rotein có trọng lượng phân tử 18KD, p18 và lõi có dạng

hình trụ được bao bọc bằng một lớp protein p24.

Phó giáo sư tiến sĩ Peijun Zhang, trưởng khoa sinh học cấu trúc thuộc Trường Đại

học y khoa Pittsburgh đồng thời là chủ dự án nghiên cứu cấu trúc capsid của virus HIV

cho biết: "Capsid vô cùng quan trọng đối với sự sinh sôi nảy nở của HIV, vì vậy, hiểu rõ

cấu trúc chi tiết của nó có thể giúp chúng ta tạo ra được những dược phẩm mới, có khả

năng chữa trị hoặc ngăn chặn lây nhiễm HIV. Khi xâm nhập vào cơ thể người, caspid

vẫn còn nguyên vẹn để bảo vệ bộ gen HIV, sau đó nó sẽ phân chia để giải phóng các

thành phần, giúp virus tái tạo làm tiền đề cho sự nhân rộng của virus. Phát triển các loại

thuốc gây rối loạn chức năng lớp vỏ bằng cách ngăn chặn lắp ráp hoặc tháo rời có thể

chống lại khả năng sinh sản của virus trong cơ thể người bệnh”.

Hình 7-3 Cấu trúc capsid của virus HIV

31

Tuy nhiên, một thách thức đặt ra là do cấu trúc caspid khá lớn, lại không đối xứng

và không đồng bộ nên các kỹ thuật phổ biến nhằm giải mã cấu trúc này như kính hiển vi

điện tử cryo-electron, chụp cắt lớp cryo-EM, X-quang cấu trúc tinh thể chưa thể thu được

những kết quả tích cực. Điều này vẫn nằm ngoài tầm với của khoa học vì không có đủ

kỹ năng tính toán mô hình hóa cấp độ nguyên tử. Vấn đề này đòi hỏi tới các SMT Blue

Waters. Nhóm nghiên cứu của phó giáo sư Peijun Zhang đã quyết định nhờ tới Trung

tâm ứng dụng SMT của Đại học Illinois tại Urbana-Champaign.

Với sự giúp sức của SMT này, nhóm nghiên cứu đến từ Đại học Pittsburgh đã tạo

nên kỳ tích để tính toán ra cách 1.300 protein kết nối với nhau như thế nào nhằm hình

thành lớp vỏ capsid hình nón. Nhóm nghiên cứu vừa chính thức tiết lộ cấu trúc caspid

hoàn chỉnh của virus HIV trong báo cáo nghiên cứu đăng tải trên tạp chí Nature. Họ cho

rằng, nắm rõ cấu trúc caspid sẽ giúp các nhà khoa học hiểu được cơ chế hoạt động và

làm thế nào có thể tấn công để phá vỡ khả năng nhân rộng của virus.

Hình 7-4 Lớp vỏ capsid hình nón của virus HIV

32

Phó giáo sư Zhang cho rằng: “Tốc độ biến đổi nhanh chóng đã giúp virus HIV có

khả năng kháng thuốc mạnh mẽ. Công trình nghiên cứu của chúng tôi sẽ mở ra triển

vọng về một phương pháp chữa trị có thể thay thế các liệu pháp điều trị HIV phổ biến

hiện nay, vốn hoạt động nhờ tấn công những enzyme nhất định hoặc tách vi rút HIV khỏi

các tế bào ADN , từ đó cho phép hệ miễn dịch của cơ thể tiêu diệt vi rút này”.

7.1.4 Siêu máy tính Watson – siêu máy tính đa năng

Kể từ khi ra đời, Watson được sử dụng cho nhiều mục đích khác nhau ở các lĩnh

vực y tế, bảo hiểm, nghiên cứu tài chính nhờ trí thông minh nhân tạo của mình. SMT

này thậm chí còn xuất hiện trong một số show truyền hình và nó có khả năng thi với

người thật. Ngoài ra IBM phát triển nó thành một dịch vụ đám mây và cũng dùng trong

các lĩnh vực tương tự như trên, ngoài ra còn mở rộng thêm ở mảng truyền thông, giá dục,

du lịch, bán lẻ, ngân hàng, phân tích số liệu kinh doanh

Watson là một hệ thống điện toán giải đáp câu mà được IBM xây dựng và nó áp

dụng các thuật toán xử lí ngôn ngữ tự nhiên, trích xuất thông minh, phát họa kiến thức,

tự động hóa. SMT này bao gồm 90 server IBM Power 750, mỗi server dùng một CPU

POWER7 với tám nhân xử lí 3,5GHz, hỗ trợ bốn luồn tính toán mỗi nhân. Tính tổng

cộng thì Watson sở hữu 2.880 nhân xử lí và RAM 16TB. Máy có khả năng xử lí 500GB

dữ liệu, tương đương 1 triệu quyển sách, trong vòng một giây. Xét về chi phí phần cứng

của Watson thì nó vào khoảng 3 triệu USD. Với sức mạnh 80 TeraFLOP, Watson không

đủ chuẩn nằm trong danh sách top500 SMT mạnh nhất thế giới.

Bên cạnh đó, IBM còn hợp tác với tạp chí ẩm thực Bon Appetit nhằm phát triển

một phần mềm khai thác sức mạnh của SMT Watson nhằm sử dụng cơ sở dữ liệu bao

gồm 9000 công thức nấu ăn của Bon Appetit để hiểu được cách phối ghép các loại

nguyên liệu, phong cách của từng loại thức ăn và làm cách nào để nấu thành một món

ăn hoàn chỉnh. Lượng "kiến thức" trên cho phép Watson đưa ra gợi ý cho người nấu

nhằm tạo ra được món ăn phù hoàn hảo nhất. Với phần mềm trên, người dùng sẽ khai

báo thông tin về các loại nguyên liệu trong món ăn, phong cách của món ăn (kiểu Ý,

33

kiểu châu Á, nhanh hay chậm, dễ hay khó làm,...) Dựa trên các thông tin này kết hợp với

kiến thức nấu ăn học được, Watson sẽ tính toán ra hàng nghìn tỷ cách kết hợp nguyên

liệu và lựa ra 100 món ăn tối ưu được sắp xếp từ thông thường đến phức tạp nhằm cung

cấp cho đầu bếp.

Ngoài việc cung cấp cho các đầu bếp một công cụ hỗ trợ, ứng dụng trên đã cung

cấp một cái nhìn khác về khả năng tính toán của các SMT. Thay vì chỉ đơn giản là thực

hiện các thuật toán hay truy vấn thông tin trong cơ sở dữ liệu, giờ đây Watson còn có thể

nhận thức một cách sâu sắc về những thông tin thu thập được và ứng dụng nó vào thực

tế.

Mặt khác, Watson còn hỗ trợ các bác sĩ tìm ra các phương pháp điều trị thông qua

đưa ra tất cả các biện pháp khả thi. Tuy nhiên, thời gian tới Watson sẽ có khả năng đưa

ra gợi ý về cách thực hiện những phương pháp điều trị nào là tối ưu nhất.

7.1.5 Siêu máy tính Stampede - mô phỏng thời tiết, mô phỏng hành vi con người,

nghiên cứu bản đồ ADN và nghiên cứu không gian

Stampede là kết quả của dự án được tài trợ bởi quĩ khoa học quốc gia Mỹ (NSF),

người ta sẽ dùng SMT này để làm những việc phục vụ khoa học như dự đoán thiên tai

(bão, lụt, động đất, sóng thần, lốc xoáy), mô phỏng các điều kiện thời tiết, mô phỏng

hành vi con người, nghiên cứu bản đồ ADN và nghiên cứu không gian. Ngoài ra

Stampede còn là hệ thống dễ truy cập và lập trình nhất, vì vậy nó sức mạnh của nó sẽ

phục vụ được rất nhiều lĩnh vực nghiên cứu như nghiên cứu môi trường, không gian lẫn

y khoa.

7.1.6 Siêu máy tính ASTRON - xử lý dữ liệu kính thiên văn radio lớn nhất thế giới

ASTRON, một Học viện về Thiên văn học Radio ở Hà Lan hợp tác trị giá 43 triệu

USD và kéo dài 5 năm với hãng máy tính IBM để cùng nhau xây dựng một hệ thống

SMT Exascale trước năm 2024, mục đích là dùng để chạy Square Kilometer Array

(SKA), một dự án xây dựng kính thiên văn radio lớn nhất thế giới kéo dài suốt 3.000 km

ở vùng đất Nam Phi hoặc Úc, trị giá 2,1 tỷ USD. SKA sẽ chính thức đi vào hoạt động

34

vào năm 2024 và nó sẽ thu thập một lượng dữ liệu tương đương 1 Exabyte mỗi ngày, và

nó cần có một SMT có sức mạnh tương đương để xử lý hết số dữ liệu đó. 1 Exabyte (EB)

tương đương 1 tỷ GB (1 Exabyte EB = 1.000 Petabyte = 1.000.000 Terabyte =

1.000.000.000 Gigabyte).

Người ta hy vọng kính thiên văn của dự án SKA sẽ mạnh gấp 50 lần các đĩa vệ

tinh hiện nay của con người, cho phép chúng ta có thể nhìn đến những nơi xa xôi nhất

của vũ trụ và nghiên cứu về nguồn gốc của nó cách đây 13 tỷ năm. Các nhà khoa học

cho biết khi SKA đi vào hoạt động, lượng dữ liệu mà nó thu thập mỗi ngày sẽ tương

đương 1 Exabyte, nhiều gấp 2 lần lượng dữ liệu được truyền tải mỗi ngày trên Internet.

Tất nhiên, hiện nay không có bất kỳ hệ thống máy tính nào có thể đảm đương

công việc này cả. Đó là lý do tại sao ASTRON và IBM phải cùng nhau phát triển một hệ

thống SMT mới mang tên Exascale. Các hệ thống SMT mạnh nhất hiện nay mà chúng

ta đang có thuộc dạng Petascale, nghĩa là có khả năng xử lý hàng triệu tỷ phép tính mỗi

giây. Máy tính Exascale sẽ mạnh hơn máy tính Petascale gấp 1.000 lần. Nếu không có

máy tính Exascale, người ta sẽ phải ghép hàng triệu chiếc máy tính mạnh nhất hiện nay

lại với nhau mới có thể vận hành kính thiên văn SKA. Từ nay đến lúc đó, IBM sẽ phải

dùng đến các công nghệ mới nhất hiện nay như Nanophotonics (Nano-optics), công nghệ

ghép chồng chip 3D và bộ nhớ chuyển pha cùng với nhiều công nghệ khác để xây dựng

thành máy tính Exascale.

7.1.7 Siêu máy tính Advanced Supercomputing HQ - dự báo thời tiết của NASA

Hàng tuần, NASA sử dụng hệ thống SMT NASA Advanced Supercomputing HQ

để thực hiện kế hoạch NEX (NASA Earth Exchange) của mình. Hệ thống SMT đặt tại

Ames Research ở California có 56.832 nhân xử lý, khả năng lưu trữ 1,4 petabyte và 128

màn hình giúp các nhà khoa học theo dõi những thay đổi về khí hậu trên toàn thế giới.

Với hệ thống này, cá nhà khoa học sẽ có thể tạo nên những mô hình và thu thập được

nhiều hình ảnh của các vùng đất khác nhau thông qua các hình mẫu, hệ thống thời tiết

và 1 số các nguyên tố sinh thái học khác.

35

Sử dụng NEX, các nhà khoa học của NASA có thể xử lý những bức hình có độ

phân giải 500 tỳ pixel thu thập trong vòng 30 năm qua về sự thay đổi hoa màu toàn cầu

chỉ trong vòng 10 tiếng. Nếu không có NEX, chúng ta phải tốn rất nhiều thời gian để xử

lý những số liệu này trong khi kết quả lại không được chia sẻ cho tất cả mọi người. Thêm

vào đó, vì NEX sẽ được cung cấp 1 cách rộng rãi nên dữ liệu của nó sẽ được phổ biến

cho tất cả người dùng. NEX làm giảm bớt sự ganh đua của các nhà khoa học trên toàn

thế giới, làm cho họ giúp đỡ nhau nhiều hơn để cùng phát triển.

7.1.8 Siêu máy tính Sequoia - mô hình quản lý vũ khí hạt nhân

Sequoia được phát triển dựa trên hệ thống 96-rack IBM Blue Gene/Q với mục

đích được sử dụng cho mô hình quản lý vũ khí hạt nhân. Bên cạnh khả năng chạy nhanh

hơn, Sequoia cũng tiêu thụ ít điện năng hơn so với SMT khác. Cụ thể là hệ thống của

IBM chỉ sử dụng 7,9 megawatt điện năng.

Sequoia sẽ cung cấp một sự hiểu biết đầy đủ hơn về hiệu năng của vũ khí hạt

nhân, đặc biệt trong thủy động lực học và tính chất vật liệu ở áp suất và nhiệt độ cao.

Đặc biệt, hệ thống sẽ cho phép tính toán định lượng giải quyết sự không chắc chắn cho

các nỗ lực kéo dài tuổi thọ các hệ thống vũ khí, những gì mà chúng ta gọi là chương trình

mở rộng cuộc sống (LEP). Hệ thống cho phép nhanh chóng sàng lọc các con số dữ liệu

lớn, cố gắng tìm ra độ ổn định và sự chắc chắn liên quan đến các thiết bị hạt nhân.

Nhà nghiên cứu Joseph Nichols (thuộc Trung tâm nghiên cứu Turbulence tại

Trường Stanford) đã sử dụng Sequoia IBM Bluegene/Q - hệ thống thuộc Phòng thí

nghiệm quốc gia Lawrence Livermore – để giải quyết vấn đề liên quan đến thủy động

lực học rất phức tạp để dự đoán và xử lý tiếng ồn động cơ máy bay phản lực siêu thanh.

Sức mạnh phối hợp của hơn 1 triệu bộ lõi máy tính này sẽ giúp thiết kế loại động cơ ít

tiếng ồn hơn. Theo Giáo sư Parviz Moin, việc tính toán mô phỏng thủy động lực học

giống như cách giải quyết của Joseph Nichols là vô cùng phức tạp. Các mô phỏng cho

phép tạo ra mô hình, đo lường tiến trình đã và đang xảy ra trong môi trường khí thải khắc

nghiệt của máy bay phản lực mà các thiết bị thông thường không tiếp cận được.

36

7.1.9 Siêu máy tính Condor - phân tích và xử lý hình ảnh của không lực Italia

Các loại SMT luôn rất đắt bất kể nó dùng để làm gì thế nhưng nếu ghép một nhiều

máy PS3 lại với nhau, chi phí sẽ rẻ hơn tới 10 lần so với bình thường. Dự án Chim kền

kền (Condor Project) dành riêng cho việc phân tích và xử lý hình ảnh của không lực

Italia hoàn toàn thực hiện theo nguyên tắc này. Được làm từ 1716 máy PS3 kết hợp với

nhau, SMT Condor được coi là một trong top 50 chiếc máy tính mạnh nhất thế giới năm

2011.

Lực lượng không quân Italia hy vọng rằng SMT Condor sẽ giải quyết hoàn toàn

vấn đề xử lý hình ảnh từ trên không trung của họ vì máy PS3 tỏ ra cực kỳ ấn tượng trong

lĩnh vực này. Với tất cả vệ tinh họ đang có, việc chụp hàng nghìn tấm ảnh không phải là

chuyện khó khăn. Điều làm tất cả ấn tượng với Condor đó là người sử dụng có thể di

chuyển camera xung quanh như thể bạn đang chơi StarCraft và có thể tua đi tua lại dựa

vào lượng thông tin đang có.

Việc phát triển Condor đã bắt đầu không lâu sau khi Sony tung ra máy PS3 trên

thị trường. Richard W.Linderman, một khoa học gia của phòng thí nghiệm Rome đã mua

thử một chiếc và tiến hành thử nghiệm. Họ dã tiến hành thử nghiệm nối 8 máy lại với

nhau xem chúng có thể làm được gì. Quá ấn tượng, họ quyết định nâng con số lên 336.

Kết quả nhận được còn tuyệt vời hơn nữa. Vậy thì hơn 1000 chiếc sẽ cho ra kết quả đến

thế nào nữa? Phòng thí nghiệm Rome đã quyết định sử dụng 1700 máy PS3. Với chi phí

rẻ hơn nhiều so với các SMT hiện hành nhưng sức mạnh tương đương, máy Condor của

Không quân Italia đã ghi dấu ấn về sự sáng tạo và thông minh.

7.1.10 Siêu máy tính The Dawn - mô phỏng các vụ nổ hạt nhân

SMT The Dawn (loại máy IBM BlueGene P) được đặt tại Terascale Simulation

Facility - Trung tâm Mô phỏng máy tính thuộc Phòng thí nghiệm Quốc gia Lawrence

Livermore. Nó được sử dụng để mô phỏng các vụ nổ hạt nhân để kiểm tra, kiểm soát và

thử nghiệm vũ khí hạt nhân được xây dựng dựa trên những dữ liệu, thông số thiết kế

thực tế của quả bom nhập vào bộ nhớ máy tính. Chương trình được thiết kế và chế tạo

37

bởi phòng thí nghiệm Livermore vào những năm cuối Chiến tranh lạnh. Đây là bước đột

phá lớn thời đó, vì lần đầu tiên con người có thể phát hiện sớm một sai sót kỹ thuật trong

quả bom. Và nhờ bước đột phá này, các nhà khoa học đã có thể hiểu biết một cách căn

bản hơn về cơ chế hoạt động của quả bom so với những gì những nhà khoa học có thể

hình dung trong các vụ nổ thử trước đây

Để tiến hành việc mô phỏng hoạt động của quả bom trên SMT, một nhóm các nhà

khoa học và thiết kế vũ khí của Mỹ đã cùng nhau kiểm tra một danh mục tất cả các điều

kiện có khả năng tác động đến quả bom hạt nhân. Ở đây, các nhà khoa học Mỹ sử dụng

quả bom chiến lược B-83 làm đối tượng mô phỏng trong chương trình SMT. B-83 là quả

bom hiện đại nhất đồng thời là một trong những vũ khí tối tân nhất trong kho vũ khí của

Mỹ hiện nay. Nó được chế tạo trong thời gian nước Mỹ đã ngưng hoàn toàn các vụ nổ

thử trong thực tế, vì vậy chương trình SMT được triển khai để thử nghiệm, kiểm tra,

kiểm soát cường độ, độ an toàn và tất cả các đặc tính khác của quả bom này. Khi thực

hiện mô phỏng kiểm tra tính an toàn và độ tin cậy trong quá trình phóng, các nhà khoa

học và thiết kế đã kiểm tra các yếu tố tác động đến quả bom như nhiệt độ, độ cao, chấn

rung và các yếu tố khác có khả năng tác động đến quả bom trong quá trình bay đến mục

tiêu.

Trước khi có chương trình SMT, việc kiểm tra thường được tiến hành bằng cách

tách rời các bộ phận (đầu đạn và thân bom), kiểm tra, thử nghiệm bằng các phương pháp

hóa học, vật lý, toán học, vật liệu học và một số lý thuyết khác; đồng thời đối chiếu, so

sánh với các số liệu nổ thử bom hạt nhân trước đó. Với SMT, các nhà khoa học không

cần phải nhọc công làm các bước kiểm tra "thủ công" mà chỉ cần mô phỏng các vụ nổ,

các kiểm nghiệm kỹ thuật bằng chương trình máy tính.

Các nhà khoa học tại các phòng thí nghiệm được trang bị các SMT mạnh nhất

hành tinh đã đi sâu nghiên cứu bí ẩn của tiến trình phân hạch khi vụ nổ xảy ra. Chính

những nghiên cứu này đã giúp làm sáng tỏ nhiều điều mà trước năm 1992 - thời điểm

38

Mỹ chấm dứt hoàn toàn các vụ nổ thử bom hạt nhân - người Mỹ đã không thể hiểu hết

được.

Với những kết quả nghiên cứu trên, Nhà Trắng tự tin tuyên bố rằng, với những

tiến bộ về công nghệ thông tin, nước Mỹ sẽ không cần phải tiến hành trở lại những vụ

nổ thử bom hạt nhân như trước nữa mà vẫn có thể thử nghiệm và kiểm tra hoàn chỉnh

những quả bom mới được chế tạo. Bởi vì, chương trình mô phỏng trên SMT không chỉ

dự báo trước những vấn đề trục trặc có thể phát sinh, giảm thiểu những rủi ro tác động

xấu đến kho vũ khí của Mỹ, mà còn tiến hành nổ thử bom hạt nhân.

7.2 Một số hãng sản xuất và cung cấp siêu máy tính

Bạn có thể thấy là IBM, HP và Cray là ba công ty dẫn đầu trên lĩnh vực SMT hiện

nay. Dell, Intel, NEC, Lenovo, Acer, Fujitsu, Oracle cũng có tham gia vào lĩnh vực này.

Hình 7-5 Biểu đồ tỉ lệ % số lượng máy tính do các công ty sản xuất SMT

7.3 Các nước có siêu máy tính

STT Quốc gia Số

lượng

Tỉ lệ

(%)

Rmax

(GFlops)

Rpeak

(GFlops) Cores

1 United States 232 46.4 122,452,336 175,406,632 9,617,949

39

2 China 76 15.2 52,129,821 102,670,220 5,432,584

3 United Kingdom 30 6 14,871,213 18,458,733 925,152

4 Japan 30 6 23,941,240 31,005,691 1,654,398

5 France 27 5.4 11,236,985 13,234,047 776,468

6 Germany 22 4.4 14,809,560 17,611,601 1,113,012

7 Canada 9 1.8 1,959,750 2,393,414 165,280

8 India 9 1.8 2,898,745 3,521,915 169,324

9 Korea, South 8 1.6 2,112,514 3,202,991 211,080

10 Australia 6 1.2 2,472,259 2,869,878 151,072

Bảng 7-1 Danh sách 10 quốc gia có số lượng SMT lớn nhất tháng 6/2014 (nguồn: phụ

lục 3)

Hình 7-6 Biểu đồ tỉ lệ % số lượng SMT của các nước trên thế giới tháng 6/2014

(nguồn: phụ lục 3)

Nhìn trên hình 7-6, Mỹ là nước chiếm gần phân nửa số lượng SMT trong top500

trên thế giới. Và theo sao là sự tăng trưởng mạnh mẽ của Trung Quốc trong lĩnh vực

SMT. Và hiện tại, Trung Quốc đang là nước có SMT mạnh nhất thế giới (phụ lục 2).

40

41

CHƯƠNG 8 : XU HƯỚNG NGHIÊN CỨU VÀ PHÁT

TRIỂN

8.1 Xu hướng phát triển sức mạnh xử lý của siêu máy tính

Tổ chức chứng nhận top 500 SMT mạnh nhất Thế giới cho biết tốc độ xuất hiện

những SMT mới đang dần bị chậm lại, hiện nay phải hơn 1 năm thì mới xuất hiện một

SMT đủ sức giành vị trí mạnh nhất, chậm hơn khá nhiều so với trước đây. Tianhe-2 (hay

còn có tên khác là Milky Way 2), một SMT của Trung Quốc, có năng lực xử lý 33,86

petaflops/giây đã liên tục nắm vị trí mạnh nhất Thế giới 3 kì liên tiếp, từ lần tổng kết

tháng 6/2013, tháng 11/2013 và mới đây là kì 6/2014.

SMT Tianhe-2 sử dụng CPU Intel Xeon E5-2692 với 12 nhân và Xeon Phi 31SP,

nền tảng Ivy Bridge, vốn có năng lực xử lý tối đa trên lý thuyết là 54,9 petaflops/giây,

hiện tại nó đang được sử dụng ở mức 33,86 petaflops/giây. Vào 6 năm trước, tháng

6/2008 thì IBM đã tạo nên Roadrunner, chiếc SMT đầu tiên đạt năng lực xử lý

petaflops/giây, và nó cũng giữ vị trí đầu bảng suốt 3 kì liền, từ 6/2008 tới 6/2009.

Trong top 10 hiện nay, chỉ có 1 SMT mới xuất hiện, là Cray XC30 của chính phủ

Mỹ, năng lực xử lý 3,14 petaflops/giây. Các SMT hiện nay đang hướng tới sức mạnh xử

lý tầm exascale, với 1 exascale mạnh hơn 1 petaflop tới 1000 lần. Tuy nhiên, các yếu tố

khác cũng không thể bỏ qua đó là tính hiệu quả về điện năng tiêu thụ, cũng như sự cân

nhắc về hiệu năng/giá thành của hệ thống.

8.2 Kiến trúc mới và tiết kiệm năng lượng tiêu thụ

“Các SMT trong tương lai sẽ phải cân nhắc nhiều hơn nữa tính tiết kiệm năng

lượng. Đồng thời, trong tương lai, chúng ta cũng phải tìm ra các giải pháp mới để xử lý

và lưu trữ những lượng dữ liệu khổng lồ liên quan đến các công việc tính toán lớn như

vậy” theo phòng thí nghiệm Los Alamos.

42

8.2.1 Siêu máy tính nền tảng ARM

Vi xử lý ARM là con chip được dùng hầu hết trên smartphone và máy tính bảng

hiện nay, và nó đang bắt đầu thu hút được các công ty trong việc trang bị cho các máy

chủ. Trong tương lai, nếu áp dụng thành công, các trung tâm dữ liệu hứa hẹn sẽ tiết kiệm

được rất nhiều điện năng, trong khi vẫn đủ đảm bảo sức mạnh xử lý. Hiện tại, Dell cũng

là hãng đã cung cấp các prototype máy chủ ARM tầm thấp đến tầm trung cho khách

hàng của mình.

Hiện nay, các siêu máy tính mạnh nhất thế giới đều sử dụng vi xử lý x86 do Intel,

AMD sản xuất; hoặc vi xử lý Power của IBM; Sparc của Oracle. Chip ARM được đánh

giá là không đủ mạnh để dùng cho siêu máy tính, là các SMT vốn được dùng cho các

công việc tính toán phức tạp. Điều này giống như trước đây với vi xử lý đồ họa. Nếu như

trước đây, chip đồ họa không giữ nhiều vai trò trong SMT, nhưng cho tới nay thì chúng

lại rất cần thiết, quan trọng không kém CPU. Vì vậy chip ARM từ trước tới nay chưa

bao giờ là đối thủ của x86 trong lĩnh vực SMT, nhưng điều này có thể sẽ thay đổi trong

tương lai.

Nhiều hãng sản xuất bắt đầu nghiên cứu dùng vi xử lý ARM để xây dựng SMT

trong tương lai. Hiện tại, Dell hiện đang tiến hành nghiên cứu các bản prototype SMT

dùng vi xử lý ARM để có thể triển khai loại SMT này trong tương lai. Hay trung tâm

SMT Barcelona (Barcelona Supercomputing Center) cũng là một trong các tổ chức tiên

phong trong việc áp dụng vi xử lý ARM cho SMT. Barcelona Supercomputing Center

đang sản xuất một bản prototype SMT dùng vi xử lý 2 nhân Exynos 5 của Samsung.

Với SMT dùng vi xử lý ARM tiết kiệm điện năng sẽ là một giải pháp cho bài toán

năng lượng tiêu thụ của SMT hiện nay. Tuy nhiên, sẽ có thể phải mất một thời gian nữa

để ARM được cộng đồng nghiên cứu chấp nhận. Các phần mềm được viết ra hiện nay

vẫn chưa có ý định nhắm tới server ARM, và các nhà nghiên cứu thường có xu hướng

viết phần mềm hướng tới các nền tảng cũ đã ổn định. ARM, x86, và Power là các vi xử

lý chạy trên các kiến trúc khác nhau và hỗ trợ các nền tảng code khác nhau.

43

8.2.2 Siêu máy tính The Machine

The Machine là một SMT trong tương lai với sức mạnh có thể hoàn toàn thay thế

được những trung tâm dự liệu khổng lồ hiện nay nhưng lại có kích thước chỉ bằng 1

chiếc tủ lạnh dân dụng thông thường. Hiện tại dự án đang được phát triển bởi phòng thí

nghiệm của HP.

Hình 8-1 Martin Fink, giám đốc công nghệ của HP và hình ảnh bộ vi xử lý của The

Machine

Về cơ bản, The Machine sở hữu các bộ vi xử lý với thiết kế kiến trúc hoàn toàn

mới nhằm thực hiện nhiệm vụ xử lý cùng lúc một lượng dữ liệu khổng lồ. The Machine

được trang bị cụm vi xử lý đa nhiệm hướng đối tượng chuyên dụng thay vì các vi xử lý

phổ biến như hiện nay. Đồng thời, SMT sử dụng hệ thống truyền tải dữ liệu bằng ánh

sáng thay cho các sợi dây đồng vốn chậm chạp, tiêu thụ nhiều năng lượng và sẽ lỗi thời

trong tương lai. Đồng thời, thay vì sử dụng bộ nhớ RAM như hiện nay, The Machine sử

dụng bộ nhớ điện trở memristor nhằm cải thiện khả năng lưu trữ, xử lý thông tin lên gấp

nhiều lần so với hiện tại.

44

The Machine có thể cùng lúc xử lý lượng dữ liệu khổng lồ trong thời gian cực kỳ

nhanh chóng nhưng chỉ tiêu thụ một lượng nhỏ điện năng. Với The Machine, vấn đề

năng lượng tiêu thụ sẽ hầu như biến mất tại các trung tâm dữ liệu. Theo số liệu từ HP,

The Machine có thể định vị 160 petabytes dữ liệu trong vòng 250 nano giây.

Hình 8-2 Martin Fink cùng với mô đun bộ nhớ của The Machine

Như vậy, The Machine mạnh hơn tới 6 lần so với các thế hệ máy chủ hiện tại và

đồng thời, lại có mức tiêu thụ điện năng thấp hơn 80 lần. Với các khả năng trên, The

Machine không chỉ được dùng làm Trung tâm dữ liệu hay SMT mà còn có thể cải tiến

thu nhỏ kích thước nhằm phù hợp với máy tính xách tay hay thậm chí là điện thoại di

động.

Đối với HP, nền tảng trên đã mở ra cánh cửa thực phát triển những mô hình máy

tính vô cùng mạnh mẽ dường như không tưởng ở thời điểm hiện tại. Nếu dự án thành

công sẽ góp phần thay đổi diện mạo không chỉ của giới công nghệ mà còn thúc đẩy sự

phát triển của nhiều lĩnh vực khác. Một bác sĩ có thể so sánh các triệu chứng của 1 bệnh

45

nhân với hàng triệu bệnh án khác từ khắp nơi trên thế giới nhằm đưa ra biện pháp điều

trị tốt hơn.

Các nhà khoa học cũng có thể tận dụng sức mạnh của The Machine nhằm phục

vụ cho công tác nghiên cứu với cơ sở dữ liệu vô cùng lớn và đòi hỏi hàng loạt các thuật

toán phức tạp. Đây chỉ là 1 trong rất nhiều ứng dụng mà cỗ SMT của HP có thể mang lại

cho con người. Trong tương lai, HP đang lên kế hoạch phát triển một hệ điều hành dành

riêng cho The Machine. Và hơn nữa, sẽ có một phiên bản Android được tối ưu hóa cho

phép người dùng có thể truy cập và khai thác The Machine thông qua các thiết bị di động

cá nhân để phục vụ cho nhu cầu cần thiết.

8.2.3 Siêu máy tính quang học

Nhỏ gọn mạnh mẽ và thân thiện với môi trường, SMT quang học đang được phát

triển bởi Optalysys hứa hẹn sẽ sớm đạt được tốc độ xử lý lên đến hàng nghìn triệu triệu

phép tính một giây (exaflops). Trước đây, công ty này đã cho ra một bản thử nghiệm

máy tính quang chạy với tốc độ 346 gigaflops, tuy chưa nhanh bằng những SMT tính

tiên tiến hiện nay, nhưng nó cho thấy một tương lai đầy hứa hẹn cho công nghệ máy tính

mới này. Dự kiến SMT quang học này sẽ ra mắt vào năm 2020

Công nghệ mới này sử dụng các hiệu ứng quang học để tính toán thay vì cách sử

dụng transitor thường thấy. Một luồng laze mật độ thấp sẽ được chiếu qua các lớp lưới

tinh thể lỏng, các lớp này làm thay đổi mật độ luồng laze dựa trên dữ liệu đầu vào. Kết

quả thu được sau khi phân tích mô hình giao thoa của luồng laze sẽ được sử dụng để giải

các phương trình và thi hành các tác vụ khác. Mặt khác, nhờ khả năng phân chia luồng

laze đi qua nhiều lớp lưới khác nhau, máy tính quang học trên lý thuyết đáp ứng khả

năng tính toán song song hiệu quả hơn nhiều so với khả năng đa xử lý thông thường của

các siêu máy tính hiện nay.

46

Hình 8-3 Mô hình hiệu ứng quang học được áp dụng cho SMT trong tương lai

Hệ thống máy tính mới cũng sử dụng rất ít năng lượng. So các siêu máy tính vận

hành khác, hệ thống có khả năng tính toán đạt mức exaflops này chỉ mất vài ngàn đôla

cho một năm hoạt động, trong khi siêu máy tính đầu bảng Tinanhe-2 ngốn đến hàng triệu

đôla và khả năng mới dừng lại mức petaflops. Optalysys dự tính sẽ thiết kế hai sản phẩm

sau khi ra mắt mẫu thử nghiệm: bộ vi xử lý quang học “big data” hoạt động tương thích

với các siêu máy tính hiện tại và siêu máy tính quang học hoạt động độc lập. Các sản

phẩm sẽ được dự tính thương mại hóa vào năm 2017 với tốc độ 9 petaflop và đạt mức

tối đa 17.1 exaflop (tương đương 17.100 petaflop) vào năm 2020. Hiện tại, siêu máy tính

nhanh nhất thế giới Tianhe-2 mới chỉ đạt mức tính toán 34 petaflop. Các con số ấn tượng

hiện tại vẫn chỉ dừng lại trên giấy, tuy nhiên chũng ta có quyền hy vọng vào tính khả thi

của công nghệ mới này khi một mẫu thử nghiệm nữa ra mắt vào tháng 1 năm 2015.

8.2.4 Siêu máy tính lượng tử

Nguyên tắc cơ bản của SMT lượng tử được hiểu là "sự chồng lượng tử", nghĩa là

một vật thể tồn tại cùng lúc ở nhiều trạng thái khác nhau. Máy tính truyền thống sử dụng

47

các bit thông tin nhị phân riêng biệt (chuỗi liên tục các giá trị 1 hoặc 0); trong khi máy

tính lượng tử sử dụng các bit lượng tử - gọi là qubit - tức đồng thời là các chuỗi giá trị 0

và 1, hay nói cách khác là sự chồng lên các trạng thái khác nhau của hệ lượng tử.

Máy tính lượng tử có khả năng thực hiện cùng lúc hàng ngàn phép tính khác nhau

do đó nó có thể giải quyết vấn đề nhanh hơn gấp nhiều lần máy tính truyền thống hiện

nay. Công nghệ lượng tử giúp tăng cường tốc độ xử lý cũng như khả năng bảo mật thông

tin cho máy tính bằng cách sử dụng sức mạnh của các nguyên tử và phân tử. Máy tính

lượng tử đặc biệt hữu ích khi được sử dụng để xử lý những vấn đề với lượng dữ liệu

khổng lồ.

Từ trước đến nay, khái niệm máy tính lượng tử vẫn còn nằm trên lý thuyết và

nhiều nhà khoa học không tin có thể biến nó thành hiện thực. Nhưng, với những tiến bộ

công nghệ vượt bậc ngày nay người ta cho rằng thời đại của máy tính lượng tử có lẽ đang

đến gần. Với máy tính lượng tử, dữ liệu không được xử lý bằng transistor (bán dẫn) nữa

mà bằng các nguyên tử gọi là "quantum bit" hay "qubit".

Hiện tại, các chuyên gia chưa dự đoán được khi nào SMT lượng tử có thể được

đưa vào sử dụng. Đầu thế kỷ 21, một số chuyên gia cho rằng việc phát triển một siêu

máy tính như thế có lẽ sẽ thành hiện thực từ 10 đến 100 năm nữa.

8.3 Và sức mạnh của siêu máy tính không chỉ là tăng tốc độ xử lý

Trong tương lai, sức mạnh của siêu máy tính không chỉ là tốc độ xử lý. Theo các

chuyên gia dự báo, đến năm 2018, SMT có thể xử lý thông tin giống như não bộ của con

người. Vào khoảng năm 2020, tốc độ xử lý sẽ đạt đến mức exaflop (1 tỉ tỉ phép tính trên

giây), gấp khoảng 1000 lần SMT hiện tại. Và trong khoảng 2025 đến 2045, SMT sẽ bắt

đầu có khả năng tự nhận thức.

Với việc SMT đang dần tiến đến giới hạn của công nghệ, các nhà khoa học đang

tìm cách để thu nhỏ bộ xử lý, kết hợp với sức mạnh công nghệ mới và tìm kiếm những

nguồn năng lượng mới nhằm làm cho SMT hoạt động hiệu quả hơn. Với những nỗ lực

48

này sẽ có thể khám phá ra một công nghệ mới mà chứng ta chưa biết đến như là việc

phát minh ra SMT vào những năm đầu thập niên 20.

49

TÀI LIỆU THAM KHẢO

1. Thái Hùng Văn, 2014, Giáo trình môn Kiến trúc máy tính và hợp ngữ

2. Trang web xếp hạng danh sách 500 SMT hàng đầu trên thế giới www.top500.org

3. Wikipedia, Supercomputer,

http://en.wikipedia.org/wiki/Supercomputer#Distributed_supercomputing truy cập

ngày 1/9/2014

4. CHLOE ALBANESIUS, Infographic: 70 Years of Supercomputers,

http://www.pcmag.com/article2/0,2817,2390970,00.asp truy cập ngày 1/9/2014

5. Wikipedia, IBM Roadrunner, http://en.wikipedia.org/wiki/IBM_Roadrunner truy

cập ngày 1/9/2014

6. Caitlin Fairchild, INFOGRAPHIC: SUPERCOMPUTERS AND THEIR

SUPERPOWERS, http://www.nextgov.com/big-data/2014/08/infographic-

supercomputers/91103/ truy cập ngày 1/9/2014

7. Dusan Belic, A supercomputer in your pocket [infographic]

http://www.intomobile.com/2013/09/25/supercomputer-your-pocket-infographic/

truy cập ngày 1/9/2014

8. GRAYSON, World’s 10 Fastest Supercomputers [Infographic],

http://dailyinfographic.com/worlds-10-fastest-supercomputers-infographic truy cập

ngày 1/9/2014

9. Trí Thức Trẻ, iPhone 5S mạnh hơn cả siêu máy tính NASA từng sử dụng,

http://kenh14.vn/2-tek/iphone-5s-manh-hon-ca-sieu-may-tinh-nasa-tung-su-dung-

20140616053942667.chn truy cập ngày 1/9/2014

10. Duy Luân, Tìm hiểu cơ bản về siêu máy tính, những cỗ máy phức tạp và mạnh mẽ,

http://www.tinhte.vn/threads/tim-hieu-co-ban-ve-sieu-may-tinh-nhung-co-may-

phuc-tap-va-manh-me.2106936/ truy cập ngày 1/9/2014

50

11. Trí Thức Trẻ, Điểm danh 10 siêu máy tính mạnh nhất thế giới, http://kenh14.vn/2-

tek/diem-danh-10-sieu-may-tinh-manh-nhat-the-gioi-201371221287924.chn truy

cập ngày 1/9/2014

12. Genk, Những sự thật thú vị có thể bạn chưa biết về siêu máy tính, http://genk.vn/pc-

do-choi-so/nhung-su-that-thu-vi-co-the-ban-chua-biet-ve-sieu-may-tinh-

20120627053959670.chn truy cập ngày 1/9/2014

13. Genk, Siêu máy tính Roadrunner lừng lẫy một thời ngừng hoạt động,

http://genk.vn/pc-do-choi-so/sieu-may-tinh-roadrunner-lung-lay-mot-thoi-ngung-

hoat-dong-20130401094531705.chn truy cập ngày 1/9/2014

14. Tinhte, Siêu máy tính Blue Waters đi vào hoạt động 24/7,

http://www.tinhte.vn/threads/sieu-may-tinh-blue-waters-di-vao-hoat-dong-24-7-

362-240-nhan-cpu-ram-1-382-petabyte.2024063/ truy cập ngày 1/9/2014

15. Genk, Dell nghiên cứu siêu máy tính nền tảng ARM, http://genk.vn/pc-do-choi-

so/dell-nghien-cuu-sieu-may-tinh-nen-tang-arm-20130330071422181.chn

16. Genk, Siêu máy tính Blue Waters - vũ khí mới trong công cuộc ngăn chặn virus HIV,

http://genk.vn/do-choi-so/sieu-may-tinh-blue-waters-vu-khi-moi-trong-cong-cuoc-

ngan-chan-virus-hiv-20130609122858415.chn truy cập ngày 1/9/2014

17. Tinhte, IBM phát triển phần mềm sử dụng sức mạnh của siêu máy tính Watson để

hỗ trợ người dùng nấu ăn, http://www.tinhte.vn/threads/ibm-phat-trien-phan-mem-

su-dung-suc-manh-cua-sieu-may-tinh-watson-de-ho-tro-nguoi-dung-nau-

an.2321413/ truy cập ngày 1/9/2014

18. Tinhte, HP tiết lộ dự án phát triển công nghệ máy tính của tương lai với tên gọi The

Machine, http://www.tinhte.vn/threads/hp-tiet-lo-du-an-phat-trien-cong-nghe-may-

tinh-cua-tuong-lai-voi-ten-goi-the-machine.2312587/ truy cập ngày 1/9/2014

19. Tinhte, Mont-Blanc, dự án siêu máy tính mạnh nhất, tiết kiệm điện nhất dùng chip

ARM, http://www.tinhte.vn/threads/mont-blanc-du-an-sieu-may-tinh-manh-nhat-

tiet-kiem-dien-nhat-dung-chip-arm.1180499/ truy cập ngày 1/9/2014

51

20. Tinhte, IBM tham gia xây dựng siêu máy tính Exascale phục vụ thiên văn học,

http://www.tinhte.vn/threads/ibm-tham-gia-xay-dung-sieu-may-tinh-exascale-

phuc-vu-thien-van-hoc.1178775/ truy cập ngày 1/9/2014

21. Tinhte, Châu Âu nhắm đến siêu máy tính dùng CPU Tegra3 và GPU Geforce,

http://www.tinhte.vn/threads/chau-au-nham-den-sieu-may-tinh-dung-cpu-tegra3-

va-gpu-geforce.935610/ truy cập ngày 1/9/2014

22. Tinhte, IBM ra mắt siêu máy tính làm mát bằng nước ấm,

http://www.tinhte.vn/threads/ibm-ra-mat-sieu-may-tinh-lam-mat-bang-nuoc-

am.438914/ truy cập ngày 1/9/2014

23. Tinhte, Siêu máy tính Advanced Supercomputing HQ dự báo thời tiết của NASA,

http://www.tinhte.vn/threads/sieu-may-tinh-advanced-supercomputing-hq-du-bao-

thoi-tiet-cua-nasa.396646/ truy cập ngày 1/9/2014

24. Tinhte, Máy tính lượng tử là gì và con người đã phát triển công nghệ này đến đâu?,

http://www.tinhte.vn/threads/may-tinh-luong-tu-la-gi-va-con-nguoi-da-phat-trien-

cong-nghe-nay-den-dau.2318643/ truy cập ngày 1/9/2014

52

PHỤ LỤC

Phụ lục 1: Lịch sử phát triển của các siêu máy tính

1. Control Data Corporation (CDC) 6600 - 1964

CDC 6600.

CDC 6600 sở hữu kích thước khá khiêm tốn – bằng khoảng bốn tủ đựng hồ sơ cỡ

trung bình. Tổng giá trị của SMT này là 8 triệu USD (tương đương 60 triệu USD ở thời

giá hiện nay). “SMT” đầu tiên của thế giới chỉ được trang bị một CPU duy nhất với tốc

độ 40MHz, khả năng tính toán tối đa ở mức 3 megaflops.

Trở lại thời điểm năm 1964, mẫu máy nhanh nhất trên thị trường lúc bấy giờ là

IBM Stretch, với diện tích mặt sàn gần 200 mét vuông và mức giá bán khoảng 13 triệu

USD. CDC 6600 ra mắt với kích thước nhỏ gọn hơn, mức giá chỉ bằng 60% trong khi

tốc độ xử lý cao gấp 10 lần. Đó chính là lý do vì sao CDC 6600 lại trở thành sản phẩm

đầu tiên được phong danh hiệu “SMT”.

53

Nói về cấu trúc vận hành, CDC 6600 đã đi trước thời đại của mình hàng chục

năm. Bộ xử lý trung tâm của mẫu máy này gồm 10 đơn vị chức năng vận hành cùng lúc,

mỗi đơn vị phụ trách những tác vụ cụ thể như: Thực hiện phép cộng, thực hiện phép chia.

Bên cạnh đó, CDC 6600 còn có thêm 10 bộ xử lý ngoại vi nhằm duy trì hiệu suất

hoạt động luôn ở mức tối đa. SMT này cũng sở hữu một cơ chế tản nhiệt rất hiệu quả,

hợp thành bởi các ống luân chuyển chất Freon chạy dọc hệ thống nối liền với một nguồn

cấp nước lạnh đặt bên ngoài.

2. Cray 1 - 1976

Cray 1.

54

Sử dụng mạch tích hợp trên nền tảng 64-bit và hoạt động ở tốc độ 80 MHz, hiệu

năng tính toán của Cray 1 có thể đạt mức 136 megaflops, bước đột phá so với con số 3

megaflops của CDC 6600. Tổng cộng, SMT này bao gồm 1662 bảng mạch và 144 IC;

toàn hệ thống được làm mát bởi cơ chế tản nhiệt bằng chất Freon lỏng.

Cray 1 sở hữu một thiết kế hết sức đặc biệt: Những mô đun xử lý tốc độ cao được

đặt gần phần thân máy hơn, nhằm tối thiểu hóa độ dài dây dẫn. Nhờ vậy, quá trình truyền

tải dữ liệu ổn định, thời gian hoạt động giữa của các mô đun được căn chỉnh hợp lý, dẫn

tới tốc độ xử lý cao hơn.

Xuất phát điểm là một SMT chuyên giả lập các mô hình vũ khí hạt nhân tại Phòng

thí nghiệm quốc gia của Mĩ tại Los Alamos, thật bất ngờ khi Cray 1 sau này trở thành

một trong những SMT thành công nhất xét trên khía cạnh thương mại, với hơn 80 đơn

vị sản phẩm được bán ra trong 7 năm (1976- 1982). Mức giá “vừa phải” (từ 5 – 8 triệu

USD) là nguyên nhân chính giải thích cho mức độ “đắt hàng” của mẫu máy này.

3. Cray X-MP - 1982

55

Cray X-MP.

Cho đến thời điểm đầu những năm 80 của thế kỉ trước, trong khi hầu hết các SMT

vẫn chỉ sử dụng một CPU duy nhất. Cray X-MP đã tạo ra bước ngoặt với 4 CPU trong

cùng một khung máy. Các CPU này có cấu trúc tương tự với CPU của Cray 1; song nhờ

tốc độ xung nhịp cao hơn (105 MHz) và băng thông bộ nhớ tăng gấp đôi, tốc độ xử lý

của từng CPU riêng biệt có thể đạt mức 200 megaflops. Với tổng khả năng xử lý lên tới

800 megaflops, Cray X-MP xứng đáng với mức giá 15 triệu USD của mình (khoảng 32

triệu USD ở thời giá hiện nay).

Một điểm đáng chú ý khác của Cray X-MP là khả năng lưu trữ ấn tượng. Mẫu

máy này sở hữu 32 đơn vị lưu trữ, với kích thước mỗi đơn vị tương đương một chiếc tủ

nhỏ và khả năng lưu trữ tối đa lên tới 1,2 GB dữ liệu. Chi phí cho mỗi GB dữ liệu được

ước tính vào khoảng … 225 nghìn USD, bù lại tốc độ truyền tải của X-MP có thể đạt

10MB/s – rất ấn tượng trong thời đại mà đĩa mềm còn là phương tiện lưu trữ thông tin

phổ biến.

56

4. Cray 2 - 1985

Cray 2.

Cũng giống như Cray 1 và Cray X-MP, Cray 2 tiếp tục sử dụng hệ thống mạch

tích hợp bao bọc trong phần khung máy hình móng ngựa. Bên trong thân máy, các bảng

mạch được sắp xếp rất khít nhau nhằm tận dụng không gian đến mức tối đa; do đó, cơ

chế tản nhiệt sử dụng chất Freon lỏng không còn hữu dụng, mà được thay thế bởi hệ

thống làm mát bằng hơi Flourinert.

57

Với hiệu năng được cải thiện đáng kể và 8 CPU hoạt động cùng lúc, trong quá

trình thiết kế Cray 2, Cray Research phải đối mặt với hiện tượng thắt cổ chai nghiêm

trọng trong băng thông bộ nhớ. Để giải quyết vấn đề này, hãng đã sử dụng các vi xử lý

bề mặt (foreground chip) để tải thông tin từ bộ nhớ chính về các vùng nhớ địa phương

thông qua các mạng dữ liệu có băng thông gigabit/giây, sau đó mới đưa chỉ dẫn đến các

vi xử lý nền (background chip) làm nhiệm vụ tính toán.

Đột phá trong cơ chế hoạt động cho phép Cray 2 đạt tốc độ xử lý tối đa lên tới 1,9

gigaflops - nhanh gấp đôi Cray X-MP và trở thành mẫu máy tính nhanh nhất thế giới cho

đến năm 1990. Trái ngược với các SMT Cray khác (chỉ được sử dụng trong các cơ quan

trực thuộc Chính phủ Mĩ), có thể bắt gặp Cray 2 trong trung tâm máy chủ của nhiều

trường đại học và tổ chức tư nhân.

5. Làn sóng Nhật Bản – nửa đầu thập niên 90

Hitachi SR2201.

58

Sau 20 năm thống trị thị trường của nước Mĩ, những năm đầu thập niên 90 chứng

kiến sự bành trường của một thế lực mới: các SMT đến từ Nhật Bản. Những đại diện

tiêu biểu cho làn sóng này có thể kể đến NEC SX-3, Fujitsu Numerical Wind Tunnel hay

Hitachi SR2201.

Sử dụng cấu trúc tương tự dòng máy Cray, những SMT này gồm nhiều vi xử lý

hoạt động song song cùng với bộ nhớ truy cập nhanh, và lần lượt trở thành các mẫu máy

tính nhanh nhất thế giới vào thời của chúng. Lấy ví dụ về Hitachi SR2201, mẫu máy này

được ra mắt vào năm 1996, với 2048 vi xử lý và hiệu năng tính toán tối đa đạt 600

gigaflops.

Cũng trong khoảng thời gian này, bắt đầu xuất hiện xu hướng chuyển từ một mạng

thông tin duy nhất tiến tới điện toán song song, khi hàng trăm thậm chí hàng ngàn CPU

được kết nối và hoạt động cùng lúc. Đó cũng là nền tảng để công nghệ vi xử lý đa lõi

phát triển sau này.

6. Intel – nửa cuối thập niên 90

ASCI Red.

59

Vì sao Intel – ông vua của thị trường vi xử lý từ những năm 70 lại chưa một lần

được nhắc đến trong các mẫu SMT cho đến tận thời điểm này? Lý do chính dẫn đến thực

tế trên là các đặc điểm đối nghịch giữa SMT và máy tính cá nhân. Trong khi một bên đặt

khả năng xử lý lên hàng đầu; bên còn lại bị giới hạn bởi nhiều yếu tố: chi phí, năng lượng

và cả độ nóng. Intel tập trung phát triển vi xử lý cho PC, vậy nên cũng dễ hiểu khi thị

trường SMT không dành cho họ.

Sau nhiều thử nghiệm thất bại, vào năm 1996, Intel cho ra mắt ASCI Red – SMT

đầu tiên cấu thành từ các loại vi xử lý đã được thương mại hóa. Sở hữu 6000 vi xử lý

Pentium Pros ở tốc độ 200 MHz, ASCI Red là SMT đầu tiên vượt qua ngưỡng 1 teraflop

(1 triệu tỷ phép tính mỗi giây). Sau này, ASCI Red tiếp tục được nâng cấp với 9298 vi

xử lý Pentium II Xeon, đạt mức 3,1 teraflops. SMT này giữ vững danh hiệu là SMT

mạnh nhất thế giới trong 4 năm liền, và là mẫu máy đầu tiên vượt qua ngưỡng 1 megawatt

điện năng tiêu thụ.

7. Beowulf Cluster – kỷ nguyên SMT … tự chế

Ví dụ về một hệ thống Beowulf Cluster.

60

Thành công của Intel như một lời khẳng định: Có thể sử dụng các loại vi xử lý đã

được thương mại hóa để sản xuất SMT. Từ đó, trào lưu “tự chế” SMT bắt đầu nổ ra. Nói

là “SMT” thì hơi phóng đại, vì thực chất Beowulf Cluster chỉ là hệ thống các máy tính

làm việc song song với nhau. Hệ thống này chia các phép toán phức tạp thành các tác vụ

nhỏ, sau đó phân công cho các máy con để xử lý đồng thời.

Thành phần cơ bản để xây dựng một hệ thống Beowulf cluster là những máy tính

cá nhân sử dụng phần mềm mã nguồn mở. Cũng chính từ trào lưu này, Linux nổi lên như

một hệ điều hành phổ biến cho các SMT. Các Beowulf Cluster có những đóng góp quan

trọng trong nhiều lĩnh vực. Lấy ví dụ, Toy Story - bộ phim hoạt hình với doanh thu 360

triệu USD - đã được sản xuất từ một hệ thống như vậy.

8. IBM – những năm đầu thế kỉ 21

Một bảng mạch của Blue Gene/L với mật độ nút mạng dày đặc.

Sau thời kỳ thống trị của Intel với ASCI Red và ASCI White, đến năm 2002, với

chi phí sản xuất 900 triệu USD và hiệu năng xử lý lên tới 35 teraflops, NEC Earth

61

Simulator giành lại ngôi vị máy tính mạnh nhất thế giới về tay Nhật Bản. Tuy nhiên, chỉ

2 năm sau, gã khổng lồ công nghệ IBM cho ra mắt SMT Blue Gene/L, mở màn cho một

series SMT “không có đối thủ” cho đến tận năm 2008.

Phiên bản đầu tiên của Blue Gene/L sở hữu 16000 nút mạng (mỗi nút gồm 2 CPU)

và đạt hiệu năng 70 teraflops. Phiên bản cuối cùng – ra mắt năm 2007 – bao gồm trên

100000 nút mạng và mức hiệu năng được đẩy lên 600 teraflops. IBM không công khai

tổng chi phí của các SMT này, nhưng nhiều nhận định cho rằng đây là một dự án tiêu

tốn nhiều tỉ USD.

Blue Gene/L là một SMT đặc biệt vì hai lý do. Thứ nhất, thay vì sử dụng các vi

xử lý mạnh mẽ nhưng tốn nhiều điện năng, mẫu máy này được cấu thành từ các chip

RSC Power PC với hiệu suất sử dụng năng lượng rất cao. Thứ hai, các nút mạng được

sắp xếp với mật độ khủng khiếp, nhưng không cần đến sự trợ giúp của bất kỳ loại tản

nhiệt nước hay hơi nào.

Blue Gene/L là máy tính mạnh nhất thế giới trong một khoảng thời gian dài, cho

đến năm 2008, khi nó bị vượt qua bởi một sản phẩm khác của IBM – SMT Roadrunner

với hiệu năng xử lý vượt qua ngưỡng … 1 petaflops (1 triệu tỷ phép tính trên giây).

9. Trung Quốc – từ năm 2010

Tianhe-1A.

62

Bước vào thế kỉ XXI, Trung Quốc đạt được những bước tiến mạnh mẽ trong mọi

lĩnh vực, bao gồm cả công nghệ sản xuất phần cứng; nhưng phải đợi đến năm 2010, quốc

gia đông dân nhất thế giới này mới lần đầu tiên lên “đỉnh” ở phân khúc SMT với Tianhe-

1A. Mẫu máy này sở hữu 14336 CPU Intel Xeon X5670 và 6168 GPU Nvidia Tesla, đạt

hiệu năng xử lý tối đa lên tới 2,5 petaflops.

Tuy nhiên, với chủ trương giảm dần sự lệ thuộc vào nguồn công nghệ nước ngoài,

thành tựu lớn nhất mà Trung Quốc đạt được cho đến thời điểm hiện tại chính là sự ra đời

của SMT Sunway. SMT này có khả năng tính toán thấp hơn Tianhe-1A, “chỉ” 1 petaflops,

nhưng 100% vi xử lý của máy mang thương hiệu bản địa Shenwei. Sunway giống như

một lời khẳng định: Trung Quốc đang dần bắt kịp và có khả năng tạo ra những sản phẩm

công nghệ cao không thua kém các quốc gia phương Tây.

10. Hiện tại và tương lai

Fujitsu's K.

Ngôi vị mẫu máy tính mạnh nhất thế giới ở thời điểm hiện tại đang thuộc về Nhật

Bản với SMT Fujitsu’s K. Mẫu máy này được cấu thành từ 88128 vi xử lý 8 lõi SD ARC

64, mỗi vi xử lý địa phương được trang bị 16 GB RAM; nhờ đó mức hiệu năng xử lý tối

đa lên tới 10 petaflops. Fujitsu’s K nắm giữ nhiều kỉ lục khác: SMT có mức điện năng

63

tiêu thụ cao nhất - 10 Megawatt (gấp 5 lần mức sản lượng của … thủy điện Hòa Bình),

SMT có giá trị lớn nhất – 100 tỷ yên Nhật (1,25 tỷ USD).

Mục tiêu tiếp theo trong cuộc đua sức mạnh SMT sẽ là mức hiệu năng tính toán

exaflops – 1 exaflop tương ứng với 1 tỷ tỷ phép toán trong một giây. Một số dự án đã

được khởi động, như Square Kilometre Array – SMT phân tích dữ liệu thiên văn của

IBM. Với tốc độ tăng trưởng hiện tại, nhiều dự báo cho rằng giới hạn trên sẽ bị vượt qua

vào khoảng năm 2018 – 2020.

64

Phụ lục 2: Danh sách các siêu máy tính mạnh mẽ nhất thế giới năm 2014

Danh sách những chiếc SMT mạnh mẽ nhất năm 2014, từ đó phần nào thấy được

tốc độ phát triển đến chóng mặt của công nghệ máy tính và sự đua tranh của các nước

tiên tiến trong lĩnh vực này.

1. Tianhe-2 (Trung Quốc)

Đứng ở vị trí quán quân trong bảng xếp hạng các SMT nhanh nhất thế giới là phiên bản

nâng cấp của Tianhe-1A, chiếc Tianhe-2. SMT đến từ Trung Quốc này có tốc độ ấn

tượng lên tới 33,86 petaflops với hệ thống kết cấu gồm đến 3.12 triệu nhân. Trong một

số điều kiện thuận lợi nhất định, thậm chí siêu máy này có thể đạt đến tốc độ khủng khiếp

hơn vào khoảng 54,9 petaflops.

2. Titan (Hoa Kỳ)

65

Là một phiên bản nâng cấp so với người tiền nhiệm của mình mang tên Jaguar, Titan có

tốc độ 17,6 petaflops, sử dụng Cray CPU và Nvidia GPU cùng 560.640 nhân. Chiếc

SMT này mới được đưa vào vận hành hoàn thiện từ đầu năm nay và chủ yếu hoạt động

trong các lĩnh vực vật lí phân tử quy mô, dựng mô hình khí hậu, phản ứng tổng hợp laser

và năng lượng.

3. Sequoia (Hoa Kỳ)

66

Sequoia là thành quả của IBM sau một thời gian dài nghiên cứu và bắt đầu được đưa vào

vận hành từ tháng Bảy năm 2012. Với tốc độ cực khủng vào cỡ 17,2 petaflops, SMT này

cần đến 1,6 triệu nhân xử lý. Sequoia được Hoa Kỳ tận dụng trong các lĩnh vực thử

nghiệm kích thích vũ khí hạt nhân, động lực học chất lỏng, các nghiên cứu sâu về thiên

văn, năng lượng, bộ gene người và biến đổi khí hậu.

4. K Computer (Nhật Bản)

67

K Computer là chiếc SMT đến từ đất nước mặt trời mọc, nó hoạt động dựa trên hệ thống

phân phối bộ nhớ gồm khoảng hơn 80.000 máy tính tiêng biệt, tốc độ đạt 10,8 petaflops,

705.024 nhân Sparc và công nghệ đa kết nối sáu chiều Tofu. K Computer chủ yếu phục

vụ cho việc tính toán các số liệu về năng lượng, tính bền vững, chăm sóc sức khỏe, biến

đổi khí hậu, các thách thức thuộc nghiên cứu vũ trụ...

5. Mira (Hoa Kỳ)

68

Còn có tên gọi khác là "IBM Mira", Mira là chiếc SMT petascale phát triển trên công

nghệ Blue Gene/Q. Máy có đến 787.432 nhân với tốc độ 8,6 petaflops. Mira ra đời để

phục vụ cho nghiên cứu thuộc các lĩnh vực khoa học vật liệu, địa chấn học, khí hậu và

hóa học. SMT này chính là câu trả lời của Mỹ trước sự ra đời của máy tính Trung Quốc

Tianhe-1A với mức chi phí để phát triển được ước tính vào khoảng 180 triệu USD.

6. Stampede (Hoa Kỳ)

69

Vận hành bởi Trung tâm điện toán tiên tiến thuộc trường Đại học Texas, Stampede tận

dụng sức mạnh của các vi xử lý Xenon cùng công nghệ đa kết nối InfiniBand với tốc độ

ước tính vào khoảng 5,2 petaflops. Từ khi ra đời đến nay, SMT này đã thực hiện thành

công khoảng 450.000 phép tính phức tạp về các vấn đề như bản đồ địa chấn, lập mô hình

băng để nghiên cứu biến đổi khí hậu, nâng cao chất lượng hình ảnh các khối u trong

não...

7. Juqueen (Đức)

70

Là thế hệ tiếp nối của SMT Jugene, Juqueen được phát triển dựa trên công nghệ Blue

Gene/Q với tốc độ 5 petaflops. Juqueen có nhiệm vụ chính là thực hiện các phép tính

phức tạp trong các lĩnh vực khoa học thần kinh, thuật toán sinh học, năng lượng, nghiên

cứu khí hậu và vật lí lượng tử. Với 458.752 nhân xử lí và lượng điện tiêu thụ 2.301

kilowatt, Juqueen là hệ thống SMT tiết kiệm năng lượng nhất thế giới.

8. Vulcan (Hoa Kỳ)

71

Được đặt tại Phòng nghiên cứu Quốc gia Lawrence Livermore, California, Vulcan ra đời

phục vụ cho hoạt động của cả chính phủ, các ngành công nghiệp quốc gia và nghiên cứu

ở các trường đại học. Vulcan sở hữu sức mạnh của 393.216 nhân xử lý với tốc độ đạt 4,3

petaflops. Chiếc SMT này được phát triển dựa trên công nghệ Blue Gene/Q của IBM,

nó bao gồm 24 kệ máy và 24.576 điểm máy tính riêng biệt.

9. SuperMUC (Đức)

72

SuperMUC là tên chiếc SMT mới nhất của Trung tân Siêu điện toán Leibniz, Đức. Hiện

SuperMUC đang hoạt động dựa trên hệ thống máy chủ IBM iDataPlex với 300TB RAM

và công nghệ siêu kết nối InfiniBand đảm bảo việc 147.456 nhân xử lý có thể hoạt động

đồng nhất và đạt công suất 2,9 petaflops. Được biết, để đảm bảo tối giản chi phí hoạt

động, các kĩ sư ở đây đã sử dụng một phương pháp làm mát khá đặc biệt cho SuperMUC.

Cụ thể, họ giảm nhiệt cho SMT bằng cách trực tiếp sử dụng nước ở nhiệt độ khoảng 40

độ C.

10. Tianhe-1A (Trung Quốc)

73

Dịch ra tiếng Việt có nghĩa là “Thiên Hà 1”, Tianhe-1A là một trong số ít những chiếc

SMT thuộc dạng petascale hiện đang hoạt động trên thế giới. Theo đó, Tianhe-1A có khả

năng chạy được ở tốc độ 2.6 petaflops (2,6 tỷ phép tính mỗi giây). Chiếc SMT này vận

hành trên hệ điều hành được phát triển theo nền tảng Linux và nó tận dụng sức mạnh kết

hợp của của Intel Xenon CPU và Nvidia GPU xuyên suốt 183.368 nhân xử lý. Hiện chiếc

SMT Tianhe-1A đang được đặt tại Trung tâm Siêu điện toán quốc gia tại Thiên Tân,

Trung Quốc với trách nhiệm xử lý các phép tính cho việc khai thác dầu khí và thiết kế

công nghiệp vũ trụ.

74

Phụ lục 3: Danh sách các nước có siêu máy tính trong top500 tháng 6/2014

STT Quốc gia Số

lượng

Tỉ lệ

(%)

Rmax

(GFlops)

Rpeak

(GFlops) Cores

1 United States 232 46.4 122,452,336 175,406,632 9,617,949

2 China 76 15.2 52,129,821 102,670,220 5,432,584

3 United Kingdom 30 6 14,871,213 18,458,733 925,152

4 Japan 30 6 23,941,240 31,005,691 1,654,398

5 France 27 5.4 11,236,985 13,234,047 776,468

6 Germany 22 4.4 14,809,560 17,611,601 1,113,012

7 Canada 9 1.8 1,959,750 2,393,414 165,280

8 India 9 1.8 2,898,745 3,521,915 169,324

9 Korea, South 8 1.6 2,112,514 3,202,991 211,080

10 Australia 6 1.2 2,472,259 2,869,878 151,072

11 Switzerland 6 1.2 7,959,572 9,847,816 263,888

12 Netherlands 5 1 1,005,527 1,381,992 62,160

13 Russia 5 1 2,046,483 3,438,216 159,828

14 Italy 5 1 5,537,409 7,055,617 268,400

15 Brazil 4 0.8 1,031,365 1,594,904 76,080

16 Saudi Arabia 4 0.8 1,981,894 2,744,515 169,232

17 Norway 3 0.6 735,400 873,164 54,400

18 Sweden 3 0.6 812,531 991,193 73,248

19 Belgium 2 0.4 319,821 393,256 19,944

20 Israel 2 0.4 347,685 860,954 41,392

21 Finland 2 0.4 378,000 436,301 20,976

75

22 Poland 2 0.4 455,909 583,605 41,852

23 Spain 2 0.4 1,199,031 1,357,824 65,280

24 Denmark 1 0.2 162,098 183,676 15,672

25 Taiwan 1 0.2 177,100 231,859 26,244

26 Malaysia 1 0.2 201,941 401,600 20,080

27 Hong Kong 1 0.2 234,248 476,928 25,920

28 Ireland 1 0.2 140,446 147,456 7,680

29 Austria 1 0.2 152,900 182,829 20,776

76

Phụ lục 4: Danh sách top10 siêu máy tính đứng đầu trong top500 tháng 6/2014

Th

ứ h

ạn

g

Địa điểm Tên hệ thống S

ố n

hân

Rm

ax

(TF

lop

/s)

Rp

eak

(TF

lop

/s)

ng

suất (k

W)

1

Đại học Quốc

gia Công nghệ

Quốc phòng,

Trung Quốc

Tianhe-2 (MilkyWay-2) - TH-IVB-FEP

Cluster, Intel Xeon E5-2692 12C

2.200 GHz, TH Express-2, Intel Xeon

Phi 31S1P,

Nhà sản xuất: NUDT

3,1

20

,00

0

33

,86

2.7

0

54

,90

2.4

0

17

,80

8

2

DOE / SC /

Phòng thí

nghiệm quốc

gia Oak Ridge,

Hoa Kỳ

Titan - Cray XK7, Opteron 6274 16C

2.200 GHz, Cray Gemini interconnect,

NVIDIA K20x,

Nhà sản xuất: Cray Inc.

56

0,6

40

17

,59

0.0

0

27

,11

2.5

0

8,2

09

3 DOE/NNSA/L

LNL, Hoa Kỳ

Sequoia - BlueGene/Q, Power BQC 16C

1.60 GHz, Custom,

Nhà sản xuất: IBM

1,5

72,8

64

17

,173

.20

20

,132

.70

7,8

90

4

Viện Khoa học

Tính toán nâng

cao RIKEN

(AICS), Nhật

Bản

K computer, SPARC64 VIIIfx 2.0 GHz,

Tofu interconnect,

Nhà sản xuất: Fujitsu

705,0

24

10,5

10

.00

11,2

80

.40

12,6

60

77

5

DOE/SC/Argo

nne National

Laboratory,

Hoa Kỳ

Mira - BlueGene/Q, Power BQC 16C

1.60 GHz, Custom,

Nhà sản xuất: IBM 786,4

32

8,5

86.6

0

10,0

66.3

0

3,9

45

6

Texas

Advanced

Computing

Center/Univ.

of Texas, Hoa

Kỳ

Stampede - PowerEdge C8220, Xeon

E5-2680 8C 2.700 GHz, Infiniband

FDR, Intel Xeon Phi SE10P,

Nhà sản xuất: Dell

46

2,4

62

5,1

68

.10

8,5

20

.10

4,5

10

7

Forschungszen

trum Juelich

(FZJ), Đức

JUQUEEN - BlueGene/Q, Power BQC

16C 1.600 GHz, Custom Interconnect,

Nhà sản xuất: IBM

45

8,7

52

5,0

08

.90

5,8

72

.00

2,3

01

8 DOE/NNSA/L

LNL, Hoa Kỳ

Vulcan - BlueGene/Q, Power BQC 16C

1.600 GHz, Custom Interconnect,

Nhà sản xuất: IBM

39

3,2

16

4,2

93

.30

5,0

33

.20

1,9

72

9

Leibniz

Rechenzentru

m, Đức

SuperMUC - iDataPlex DX360M4,

Xeon E5-2680 8C 2.70 GHz, Infiniband

FDR,

Nhà sản xuất: IBM

147

,456

2,8

97

.00

3,1

85

.10

3,4

23

10

National

Supercomputi

ng Center in

Tianjin, Trung

Quốc

Tianhe-1A - NUDT YH MPP, Xeon

X5670 6C 2.93 GHz, NVIDIA 2050,

Nhà sản xuất: NUDT

186

,36

8

2,5

66.0

0

4,7

01.0

0

4,0

40

78

Phụ lục 5: Danh sách các siêu máy tính đứng đầu top500 từ tháng 6/1993 đến tháng

6/2014

List

Site System C

ores

Rm

ax

(TF

lop

/s)

Rp

eak

(TF

lop

/s)

Po

wer (k

W)

01

/06

/20

14

National Super

Computer Center

in Guangzhou

China

Tianhe-2 (MilkyWay-2) -

TH-IVB-FEP Cluster, Intel

Xeon E5-2692 12C

2.200GHz, TH Express-2,

Intel Xeon Phi 31S1P

NUDT

3,1

20

,00

0

33

,86

2.7

0

54

,90

2.4

0

17

,80

8

01

/11

/20

13

National Super

Computer Center

in Guangzhou

China

Tianhe-2 (MilkyWay-2) -

TH-IVB-FEP Cluster, Intel

Xeon E5-2692 12C

2.200GHz, TH Express-2,

Intel Xeon Phi 31S1P

NUDT

3,1

20

,00

0

33

,86

2.7

0

54

,90

2.4

0

17

,80

8

01

/06

/20

13

National

University of

Defense

Technology

China

Tianhe-2 (MilkyWay-2) -

TH-IVB-FEP Cluster, Intel

Xeon E5-2692 12C

2.200GHz, TH Express-2,

Intel Xeon Phi 31S1P

NUDT

3,1

20,0

00

33

,862.7

0

54

,902.4

0

17

,808

79

01/1

1/2

01

2

DOE/SC/Oak

Ridge National

Laboratory

United States

Titan - Cray XK7 , Opteron

6274 16C 2.200GHz, Cray

Gemini interconnect,

NVIDIA K20x

Cray Inc.

560,6

40

17,5

90.0

0

27,1

12.5

0

8,2

09

01/0

6/2

01

2

DOE/NNSA/LLN

L

United States

Sequoia - BlueGene/Q,

Power BQC 16C 1.60 GHz,

Custom

IBM

1,5

72,8

64

16,3

24.8

0

20,1

32.7

0

7,8

90

01

/11

/20

11

RIKEN Advanced

Institute for

Computational

Science (AICS)

Japan

K computer, SPARC64

VIIIfx 2.0GHz, Tofu

interconnect

Fujitsu

70

5,0

24

10

,51

0.0

0

11

,28

0.4

0

12

,65

9.9

0

01

/06

/20

11

RIKEN Advanced

Institute for

Computational

Science (AICS)

Japan

K computer, SPARC64

VIIIfx 2.0GHz, Tofu

interconnect

Fujitsu

54

8,3

52

8,1

62

.00

8,7

73

.60

9,8

98

.60

01/1

1/2

01

0

National

Supercomputing

Center in Tianjin

China

Tianhe-1A - NUDT TH

MPP, X5670 2.93Ghz 6C,

NVIDIA GPU, FT-1000 8C

NUDT

186

,36

8

2,5

66.0

0

4,7

01.0

0

4,0

40

80

01/0

6/2

01

0

DOE/SC/Oak

Ridge National

Laboratory

United States

Jaguar - Cray XT5-HE

Opteron 6-core 2.6 GHz

Cray Inc.

224,1

62

1,7

59.0

0

2,3

31.0

0

6,9

50

01/1

1/2

00

9

DOE/SC/Oak

Ridge National

Laboratory

United States

Jaguar - Cray XT5-HE

Opteron 6-core 2.6 GHz

Cray Inc.

224,1

62

1,7

59.0

0

2,3

31.0

0

6,9

50

01

/06

/20

09

DOE/NNSA

/LANL

United States

Roadrunner - BladeCenter

QS22/LS21 Cluster,

PowerXCell 8i 3.2 Ghz /

Opteron DC 1.8 GHz,

Voltaire Infiniband

IBM

12

9,6

00

1,1

05

.00

1,4

56

.70

2,4

83

01

/11

/20

08

DOE/NNSA

/LANL

United States

Roadrunner - BladeCenter

QS22/LS21 Cluster,

PowerXCell 8i 3.2 Ghz /

Opteron DC 1.8 GHz,

Voltaire Infiniband

IBM

12

9,6

00

1,1

05

.00

1,4

56

.70

2,4

83

01/0

6/2

00

8

DOE/NNSA/LAN

L

United States

Roadrunner - BladeCenter

QS22/LS21 Cluster,

PowerXCell 8i 3.2 Ghz /

Opteron DC 1.8 GHz,

Voltaire Infiniband

IBM

12

2,4

00

1,0

26.0

0

1,3

75.8

0

2,3

45

81

01/1

1/2

00

7

DOE/NNSA

/LLNL

United States

BlueGene/L - eServer Blue

Gene Solution

IBM

212,9

92

478.2

596.4

2,3

29

01/0

6/2

00

7

DOE/NNSA

/LLNL

United States

BlueGene/L - eServer Blue

Gene Solution IBM

131,0

72

280.6

367

1,4

33

01

/11

/20

06

DOE/NNSA/LLN

L

United States

BlueGene/L - eServer Blue

Gene Solution IBM

13

1,0

72

28

0.6

36

7

1,4

33

01

/06

/20

06

DOE/NNSA

/LLNL

United States

BlueGene/L - eServer Blue

Gene Solution IBM

13

1,0

72

28

0.6

36

7

1,4

33

01

/11

/20

05

DOE/NNSA

/LLNL

United States

BlueGene/L - eServer Blue

Gene Solution

IBM

13

1,0

72

28

0.6

36

7

1,4

33

82

01/0

6/2

00

5

DOE/NNSA/LLN

L

United States

BlueGene/L - eServer Blue

Gene Solution

IBM

65,5

36

136.8

183.5

716

01/1

1/2

00

4

IBM/DOE

United States

BlueGene/L beta-System -

BlueGene/L DD2 beta-

System (0.7 GHz PowerPC

440)

IBM

32,7

68

70.7

91.8

01

/06

/20

04

Japan Agency for

Marine -Earth

Science and

Technology

Japan

Earth-Simulator

NEC

5,1

20

35

.9

41

3,2

00

01

/11

/20

03

Japan Agency for

Marine -Earth

Science and

Technology

Japan

Earth-Simulator

NEC

5,1

20

35

.9

41

3,2

00

01

/06

/20

03

Japan Agency for

Marine -Earth

Science and

Technology

Japan

Earth-Simulator

NEC

5,1

20

35

.9

41

3,2

00

83

01/1

1/2

00

2

Japan Agency for

Marine -Earth

Science and

Technology

Japan

Earth-Simulator

NEC 5,1

20

35.9

41

3,2

00

01/0

6/2

00

2

Japan Agency for

Marine -Earth

Science and

Technology

Japan

Earth-Simulator

NEC

5,1

20

35.9

41

3,2

00

01

/11

/20

01

Lawrence

Livermore

National

Laboratory

United States

ASCI White, SP Power3 375

MHz

IBM

8,1

92

7.2

12

.3

01

/06

/20

01

Lawrence

Livermore

National

Laboratory

United States

ASCI White, SP Power3 375

MHz

IBM

8,1

92

7.2

12

.3

84

01/1

1/2

00

0

Lawrence

Livermore

National

Laboratory

United States

ASCI White, SP Power3 375

MHz

IBM

8,1

92

4.9

12.3

01/0

6/2

00

0

Sandia National

Laboratories

United States

ASCI Red

Intel

9,6

32

2.4

3.2

01

/11

/19

99

Sandia National

Laboratories

United States

ASCI Red

Intel

9,6

32

2.4

3.2

01

/06

/19

99

Sandia National

Laboratories

United States

ASCI Red

Intel

9,4

72

2.1

3.2

01/1

1/1

99

8

Sandia National

Laboratories

United States

ASCI Red

Intel

9,1

52

1.3

1.8

01/0

6/1

99

8

Sandia National

Laboratories

United States

ASCI Red

Intel

9,1

52

1.3

1.8

85

01/1

1/1

99

7

Sandia National

Laboratories

United States

ASCI Red

Intel

9,1

52

1.3

1.8

01/0

6/1

99

7

Sandia National

Laboratories

United States

ASCI Red

Intel

7,2

64

1.1

1.5

01

/11

/19

96

Center for

Computational

Sciences,

University of

Tsukuba

Japan

CP-PACS/2048

Hitachi/Tsukuba

2,0

48

0.4

0.6

01

/06

/19

96

University of

Tokyo

Japan

SR2201/1024

Hitachi

1,0

24

0.2

0.3

01/1

1/1

99

5

National

Aerospace

Laboratory of

Japan

Japan

Numerical Wind Tunnel

Fujitsu

140

0.2

0.2

86

01/0

6/1

99

5

National

Aerospace

Laboratory of

Japan

Japan

Numerical Wind Tunnel

Fujitsu

140

0.2

0.2

01

/11

/19

94

National

Aerospace

Laboratory of

Japan

Japan

Numerical Wind Tunnel

Fujitsu

140

0.2

0.2

01

/06

/19

94

Sandia National

Laboratories

United States

XP/S140

Intel

3,6

80

0.1

0.2

01

/11

/19

93

National

Aerospace

Laboratory of

Japan

Japan

Numerical Wind Tunnel

Fujitsu

14

0

0.1

0.2

87

01/0

6/1

99

3

Los Alamos

National

Laboratory

United States

CM-5/1024

Thinking Machines

Corporation 1,0

24

0.1

0.1