Post on 20-Feb-2023
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
KHOA CÔNG NGHỆ THÔNG TIN
LÊ QUỐC ĐẠT - 1388209
SIÊU MÁY TÍNH
ĐỒ ÁN MÔN
KIẾN TRÚC MÁY TÍNH VÀ HỢP NGỮ
GIÁO VIÊN HƯỚNG DẪN
THÁI HÙNG VĂN
Thành phố Hồ Chí Minh, năm 2014
MỤC LỤC
Mục lục
Danh mục từ viết tắt
Danh mục bảng
Danh mục hình
Danh mục phụ lục
CHƯƠNG 1 : GIỚI THIỆU SIÊU MÁY TÍNH ............................................................ 1
1.1 Các thuật ngữ liên quan đến siêu máy tính ............................................................ 1
1.2 Siêu máy tính là gì? ................................................................................................ 2
1.3 Siêu máy tính dành cho ai? .................................................................................... 3
1.4 Một siêu máy tính giá bao nhiêu? .......................................................................... 3
1.5 Siêu máy tính có thể mạnh hơn thêm bao nhiêu? .................................................. 3
1.6 "Tuổi thọ" của siêu máy tính? ................................................................................ 4
CHƯƠNG 2 : LỊCH SỬ PHÁT TRIỂN CỦA SIÊU MÁY TÍNH ................................ 5
2.1 Giai đoạn trước năm 1990...................................................................................... 5
2.2 Giai đoạn sau năm 1990 ......................................................................................... 6
CHƯƠNG 3 : KIẾN TRÚC VÀ PHẦN CỨNG SIÊU MÁY TÍNH ............................. 9
3.1 Kiến trúc ................................................................................................................. 9
3.1.1 Kiểu điện toán phân tán ................................................................................... 9
3.1.2 Kiểu điện toán tập trung ................................................................................ 10
3.2 Phần cứng ............................................................................................................. 11
3.3 Tản nhiệt, tiêu thụ năng lượng ............................................................................. 15
CHƯƠNG 4 : HỆ ĐIỀU HÀNH VÀ PHẦN MỀM .................................................... 19
4.1 Hệ điều hành ........................................................................................................ 19
4.2 Công cụ phần mềm .............................................................................................. 20
CHƯƠNG 5 : SIÊU MÁY TÍNH KIẾU PHÂN TÁN ................................................ 21
5.1 Phương pháp cơ hội - opportunistic ..................................................................... 21
5.2 Phương pháp cận cơ hội - quasi-opportunistic .................................................... 22
CHƯƠNG 6 : ĐO ĐẠC HIỆU NĂNG ........................................................................ 23
6.1 Khả năng và dung lượng ...................................................................................... 23
6.2 Đo đạc hiệu năng siêu máy tính ........................................................................... 23
6.3 Danh sách TOP500 .............................................................................................. 24
CHƯƠNG 7 : ỨNG DỤNG VÀ NHỮNG THÔNG TIN KHÁC ............................... 26
7.1 Một số ứng dụng của siêu máy tính: .................................................................... 26
7.1.1 Siêu máy tính Titan - nghiên cứu về biến đổi khí hậu và nhiên liệu thay thế
27
7.1.2 Siêu máy tính Roadrunner - mô hình hóa sự phân hủy của kho vũ khí hạt
nhân của Mỹ ............................................................................................................... 28
7.1.3 Siêu máy tính Blue Waters - vũ khí mới trong việc ngăn chặn virus HIV ... 28
7.1.4 Siêu máy tính Watson – siêu máy tính đa năng ............................................ 32
7.1.5 Siêu máy tính Stampede - mô phỏng thời tiết, mô phỏng hành vi con người,
nghiên cứu bản đồ ADN và nghiên cứu không gian .................................................. 33
7.1.6 Siêu máy tính ASTRON - xử lý dữ liệu kính thiên văn radio lớn nhất thế giới
33
7.1.7 Siêu máy tính Advanced Supercomputing HQ - dự báo thời tiết của NASA
34
7.1.8 Siêu máy tính Sequoia - mô hình quản lý vũ khí hạt nhân ........................... 35
7.1.9 Siêu máy tính Condor - phân tích và xử lý hình ảnh của không lực Italia.... 36
7.1.10 Siêu máy tính The Dawn - mô phỏng các vụ nổ hạt nhân ............................ 36
7.2 Một số hãng sản xuất và cung cấp siêu máy tính ................................................. 38
7.3 Các nước có siêu máy tính ................................................................................... 38
CHƯƠNG 8 : XU HƯỚNG NGHIÊN CỨU VÀ PHÁT TRIỂN ............................... 41
8.1 Xu hướng phát triển sức mạnh xử lý của siêu máy tính ...................................... 41
8.2 Kiến trúc mới và tiết kiệm năng lượng tiêu thụ ................................................... 41
8.2.1 Siêu máy tính nền tảng ARM ........................................................................ 42
8.2.2 Siêu máy tính The Machine .......................................................................... 43
8.2.3 Siêu máy tính quang học ............................................................................... 45
8.2.4 Siêu máy tính lượng tử .................................................................................. 46
8.3 Và sức mạnh của siêu máy tính không chỉ là tăng tốc độ xử lý .......................... 47
TÀI LIỆU THAM KHẢO ............................................................................................... 49
PHỤ LỤC ................................................................................................................ 52
DANH MỤC BẢNG
Bảng 6-1 Danh sách 10 SMT mạnh nhất tháng 6/2014 .................................................... 25
Bảng 7-1 Danh sách 10 quốc gia có số lượng SMT lớn nhất tháng 6/2014 ...................... 39
DANH MỤC HÌNH
Hình 1-1 Sequoia – SMT mạnh nhất thế giới năm 2012. .................................................... 2
Hình 2-1 SMT Cray-1.......................................................................................................... 6
Hình 2-2 Biểu đồ tốc độ xử lý của siêu máy tính từ tháng 6/1993 đến tháng 6/2009 ......... 6
Hình 2-3 Biểu đồ số lượng core và tốc độ xử lý của siêu máy tính từ tháng 6/1910 đến
tháng 6/2014 ........................................................................................................................ 7
Hình 3-1 Mô hình kiểu điện toán phân tán .......................................................................... 9
Hình 3-2 Cấu trúc một hệ thống SMT kiểu điện toán tập trung ........................................ 10
Hình 3-3 Mô hình SMT dạng Massively Parallel Processors (MPP)................................ 11
Hình 3-4 Kết nối dây trong SMT Titan ............................................................................. 12
Hình 3-5 Một node của SMT Titan ................................................................................... 13
Hình 3-6 Cấu trúc của hãng Cray dùng trong Titan .......................................................... 14
Hình 3-7 Chi tiết phần cứng CPU Tegra 3 v2 GPU GeForce ........................................... 15
Hình 3-8 Cấu trúc SMT dùng CPU Tegra 3 v2 GPU GeForce ......................................... 15
Hình 3-9 Hệ thống tản nhiệt bằng nước của Titan ............................................................ 16
Hình 3-10 Mô hình SMT làm mát bằng nước ấm ............................................................. 17
Hình 4-1 Đồ thị tỉ lệ % các hệ điều hành dùng cho SMT ................................................. 19
Hình 5-1 Cấu trúc hệ thống điện toán grid kết nối với nhiều máy tính qua internet ......... 21
Hình 7-1 Ảnh mô phỏng do SMT dựng ra của Cơ quan Khí tượng và Hải dương Mỹ
(NOAA) ............................................................................................................................. 26
Hình 7-2 Cấu trúc virus HIV ............................................................................................. 29
Hình 7-3 Cấu trúc capsid của virus HIV ........................................................................... 30
Hình 7-4 Lớp vỏ capsid hình nón của virus HIV .............................................................. 31
Hình 7-5 Biểu đồ tỉ lệ % số lượng máy tính do các công ty sản xuất SMT ...................... 38
Hình 7-6 Biểu đồ tỉ lệ % số lượng SMT của các nước trên thế giới tháng 6/2014 (nguồn:
phụ lục 3) ........................................................................................................................... 39
Hình 8-1 Martin Fink, giám đốc công nghệ của HP và hình ảnh bộ vi xử lý của The
Machine ............................................................................................................................. 43
Hình 8-2 Martin Fink cùng với mô đun bộ nhớ của The Machine ................................... 44
Hình 8-3 Mô hình hiệu ứng quang học được áp dụng cho SMT trong tương lai .............. 46
DANH MỤC PHỤ LỤC
Phụ lục 1: Lịch sử phát triển của các siêu máy tính..................................................... 52
Phụ lục 2: Danh sách các siêu máy tính mạnh mẽ nhất thế giới năm 2014 ............... 64
Phụ lục 3: Danh sách các nước có siêu máy tính trong top500 tháng 6/2014 ............ 74
Phụ lục 4: Danh sách top10 siêu máy tính đứng đầu trong top500 tháng 6/2014 ..... 76
Phụ lục 5: Danh sách các siêu máy tính đứng đầu top500 từ tháng 6/1993 đến tháng
6/2014 ................................................................................................................................ 78
1
CHƯƠNG 1 : GIỚI THIỆU SIÊU MÁY TÍNH Trong thời gian gần đây chắc hẳn các bạn cũng được nghe nói nhiều về cụm từ
siêu máy tính (SMT), hay supercomputer. Đây là một loại máy tính rất khác với những
chiếc desktop, laptop mà bạn sử dụng hằng ngày. Nó có kích thước to hơn, sức mạnh
vượt trội hơn rất nhiều lần so với các máy tính cá nhân. Cũng chính vì thế mà SMT
không bao giờ được dùng để soạn văn bản, chơi game hay những ứng dụng bình thường
mà nó được dùng vào những việc như nghiên cứu khoa học, xử lí và tính toán phức tạp.
Vậy SMT là gì, cấu tạo nó ra sao và người ta dùng nó vào việc gì?
1.1 Các thuật ngữ liên quan đến siêu máy tính
Để có thể hiểu được SMT là gì và sự khác biệt giữa các SMT, trước tiên cần hiểu
rõ sự khác biệt giữa một số thuật ngữ chính bao gồm:
Hz, MHz, GHz, …: Các đơn vị tần số dùng để đo số chu kì tính toán của các thiết
bị điện tử (hay còn gọi là xung nhịp).
Máy tính có tốc độ 1 MHz tương đương với khả năng thực hiện được 1 nghìn tỷ
vòng lặp tính toán trong 1 giây. Xét trong một dòng chip thì tần số càng cao ứng với tốc
độ xử lý càng cao; tuy nhiên, khó có thể sử dụng tiêu chí này để so sánh sức mạnh của
các dòng chip khác nhau. Lý do là vì một chu kì tính toán bao gồm một số lượng phép
toán nhất định, và con số này là riêng biệt đối với từng loại chip.
Flops (Floating point operations per second), Megaflops, Gigaflops, … : Số phép
tính thực hiện được trong mỗi giây.
Máy tính có tốc độ xử lý 1 Megaflop tương đương với khả năng thực hiện 1 triệu
phép toán trên tập số thực trong 1 giây. Cũng là một đại lượng đặc trưng cho tốc độ xử
lý, nhưng Flops ưu việt hơn xung nhịp ở hai điểm:
Thứ nhất, số phép tính trên giây có thể được so sánh trực tiếp trên các loại
chip khác nhau.
2
Thứ hai, đa số các SMT sau này đều được cấu thành từ một hệ thống rất
nhiều vi xử lý; do đó, một đại lượng mang tính cộng dồn như Flops sẽ cho
kết quả chính xác hơn xung nhịp rất nhiều.
1.2 Siêu máy tính là gì?
SMT là một loại máy tính có tính năng và tốc độ xử lý siêu lớn. Bên trong SMT
là một hệ thống những máy tính mạnh làm việc song song (Thái Hùng Văn, 2014).
SMT hiện nay có tốc độ xử lý hàng ngàn teraflop (một teraflop tương đương với
hiệu suất một ngàn tỷ phép tính/giây). ( 1 pera = 1000 tera, 1 tera = 1000 giga, 1 giga =
1000 mega, 1 mega = 1000 kilo, 1 kilo = 1000).
Ví dụ như Sequoia - SMT của IBM, là một tập hợp của nhiều hệ thống Blue Gene
thế hệ thứ 3, chạy trên 1,6 triệu vi xử lý. Nó có thể đạt tốc độ xử lý tới 20 petaflop. Một
petaflop tương đương 10^15 (10 triệu tỷ) phép tính/giây, có nghĩa Sequoia có tốc độ tính
toán 20.300 (20 x 10^15) phép tính/giây.
Hình 1-1 Sequoia – SMT mạnh nhất thế giới năm 2012.
Toàn bộ SMT này cần 3.000 gallon (hơn 11.356 mét khối) nước mỗi phút để làm
mát, tiêu tốn trung bình 6 đến 7 megawatt và có khi lên tới 9,5 megawatt điện (1
megawatt tương đương 1 triệu watt điện). Chi phí cho năng lượng là rất lớn, tương đương
3
6 đến 7 triệu USD mỗi năm. 1,6 triệu nhân xử lý nằm trên 96 giá đỡ khác nhau. Mỗi giá
đỡ này nặng gần 5000 pound (khoảng 2.667 kg) và tỏa ra trung bình 100 kilowatt năng
lượng.
1.3 Siêu máy tính dành cho ai?
SMT dành cho các nhà nghiên cứu. Bản thân khái niệm về các nhà nghiên cứu
cũng khá rộng lớn và phức tạp. Công việc của họ bao gồm từ tìm cách mô phỏng các
phản ứng xảy ra trong mặt trời cho đến việc mô hình hóa các hệ thống vật lý như động
cơ máy bay, khí hậu trái đất và hệ thống mạch máu người.
Các quyết định về chính sách quan trọng, trong nhiều trường hợp, thường dựa vào
các kết quả tính toán mà các nhà nghiên cứu tìm ra, do đó, những kết quả này đồi hỏi độ
chính xác rất cao - một nhiệm vụ quả thực không hề dễ dàng. Vì vậy, SMT là một yếu
tố hỗ trợ hiệu quả cho những nghiên cứu đó.
1.4 Một siêu máy tính giá bao nhiêu?
Khoảng 6 đến 7 triệu USD chi phí cho năng lượng hàng năm, một SMT có chi
phí lắp đặt ban đầu từ 100 đến 250 triệu USD để thiết kế và lắp ráp. Đó là chưa kể đến
chi phí bảo trì chúng.
1.5 Siêu máy tính có thể mạnh hơn thêm bao nhiêu?
Liệu bạn có thắc mắc vì sao Sequoia cần tới 1,6 triệu nhân xử lý? Đó là do vi xử
lý không còn khả năng mạnh hơn được nữa. Do các định luật vật lý đã bắt đầu đi đến
giới hạn nên một trong những yếu tố giúp vi xử lý chạy nhanh hơn là tăng xung nhịp của
chúng. Tuy nhiên, chúng ta không thể tăng xung theo ý thích bởi độ nóng mà vi xử lý
tỏa ra có thể "đốt" luôn cả chiếc SMT đó. Nếu chúng ta không thể tìm cách giúp vi xử lý
nhanh hơn, đơn giản là chúng ta phải dùng đến nhiều con chip hơn. Đó là lý do các SMT
càng mạnh thì càng to lớn.
Vậy trên lý thuyết, liệu có thể tạo ra một SMT với 100 triệu nhân xử lý và tiêu
thụ 100 megawatt điện? Có lẽ là không. Đó là lý do vì sao các nhà nghiên cứu hy vọng
sẽ có những công nghệ mới giúp máy tính đạt tốc độ 10^18 phép tính/giây.
4
1.6 "Tuổi thọ" của siêu máy tính?
Không quá lâu. Trong thực tế, một SMT có "vòng đời" còn thấp hơn cả chiếc máy
Xbox 360. Các SMT thường chỉ tồn tại 2 đến 5 năm. Tác dụng của chúng thường trong
khoảng 5 năm. Sau đó, chẳng còn lý do gì mà giữ lại các SMT này do chi phí bảo trì
cũng như chi phí phải bỏ ra để đảm bảo hoạt động cho chúng là quá lớn. Sau "vòng đời"
trên cũng là lúc bắt tay xây dựng một SMT mới.
Ví dụ như chiếc siêu máy tính Roadrunner được IBM phát triển ra để mô hình
hóa sự phân hủy của kho vũ khí hạt nhân của Mỹ vào năm 2008. Tại thời điểm đó,
Roadrunner cho sức mạnh tính toán mà không có chiếc máy tính nào trên thế giới có thể
đạt tới: 1 petaflop (1 triệu tỷ phép tính mỗi giây). Với sức mạnh của mình, Roadrunner
đã giành vị trí siêu máy tính mạnh nhất thế giới ở tận 3 thời điểm: tháng 6 năm 2008,
tháng 11 năm 2008 và tháng 6 năm 2009. Tuy nhiên, sau 5 năm hoạt đông, Roadrunner
đã trở nên lỗi thời và nó đang có kế hoạch để bị phá bỏ hoàn toàn.
5
CHƯƠNG 2 : LỊCH SỬ PHÁT TRIỂN CỦA SIÊU
MÁY TÍNH
SMT đã phát triển rất mạnh mẽ trong thời gian vừa qua. Những SMT ngày nay
có thể thực hiện số phép tính mỗi giây nhiều hơn gấp hàng triệu lần so với những SMT
ở những năm 1940. Trong 25 năm trở lại đây, tốc độ và khả năng của những SMT đã
được nhân lên hàng triệu lần (phụ lục 1). Có thể chia lịch sử phát triển của SMT thành
hai giai đoạn: giai đoạn trước năm 1990 và giai đoạn sau năm 1990 đến nay.
2.1 Giai đoạn trước năm 1990
Cụm từ SMT (supercomputer) lần đầu tiên xuất hiện trong một bài báo của tờ
New York World vào năm 1929 dùng để chỉ các bảng tính khổng lồ mà IBM thiết lập ở
Đại học Columbia. Những 1960, kiến trúc SMT được một kĩ sư người Mỹ tên là Seymour
Cray làm việc cho tổ chức Control Data Corporation (CDC) thiết kế và chiếc CDC 6600
ra mắt năm 1964 được xem là supercomputer đầu tiên của thế giới. Seymour Cray được
tôn vinh là cha đẻ của SMT.
Sau đó một thời gian, Cray muốn rời CDC cùng với một số đồng nghiệp nhưng
bị CEO William Norris của công ty này từ chối vì Cray đang làm việc trên một dự án
cho Hải quân Mỹ. Mãi đến năm 1972 Cray mới thực hiện được ý định này và ông đã lập
ra công ty riêng mang tên Cray Research. Sau này Cray Research đổi tên thành Cray Inc.
và đây là một trong những hãng cung cấp SMT hàng đầu thế giới ở thời điểm hiện tại.
Tại công ty riêng của mình, năm 1976, Cray đã công bố chiếc supercomputer
Cray-1 với CPU 80MHz và nó là một trong những SMT được người ta biết đến nhiều
nhất. SMT Cray-1 với thiết kế hình trụ, đảm bảo khoảng cách giữa vi xử lí với các thành
phần khác trong hệ thống là đều nhau. Tới năm 1985, Cray-2 ra mắt với 8 vi xử lí. Hệ
thống này được làm mát bằng chất lỏng và chất flourinert do 3M sản xuất. SMT này có
tốc độ tính toán 1,9 gigaflops và nó chính là SMT nhanh nhất thế giới đến tận những
năm 1990.
6
Hình 2-1 SMT Cray-1
Với những SMT trong giai đoạn này có thể đánh giá là khả năng tính toán cũng
giống như con người.
2.2 Giai đoạn sau năm 1990
Hình 2-2 Biểu đồ tốc độ xử lý của siêu máy tính từ tháng 6/1993 đến tháng 6/2009
(nguồn: phụ lục 5)
0.00
500.00
1,000.00
1,500.00
2,000.00
2,500.00
01
/06
/19
93
01
/02
/19
94
01
/10
/19
94
01
/06
/19
95
01
/02
/19
96
01
/10
/19
96
01
/06
/19
97
01
/02
/19
98
01
/10
/19
98
01
/06
/19
99
01
/02
/20
00
01
/10
/20
00
01
/06
/20
01
01
/02
/20
02
01
/10
/20
02
01
/06
/20
03
01
/02
/20
04
01
/10
/20
04
01
/06
/20
05
01
/02
/20
06
01
/10
/20
06
01
/06
/20
07
01
/02
/20
08
01
/10
/20
08
01
/06
/20
09
Rpeak (TFlop/s)
Rpeak (TFlop/s)
7
Nếu như những chiếc SMT của năm 1980 chỉ dùng vài CPU thì đến năm 1990,
SMT đã được trang bị hàng nghìn bộ vi xử lí và chúng bắt đầu xuất hiện nhiều ở Mỹ,
Nhật. Kể từ đây, tốc độ tính toán của loại máy tính này bắt đầu tăng vọt một cách nhanh
chóng (hình 2-2). Ví dụ như chiếc SMT dùng trong hầm gió của Fujitsu sử dụng 166 vi
xử lí vector* với tốc độ 1,7 gigaflops mỗi chip vào năm 1994. Hai năm sau đó, đến lượt
máy Hitachi SR2201 với tốc độ 600 gigaflops có được nhờ 2048 bộ xử lí cũng đã làm
cho cả thế giới kinh ngạc. Intel cũng có SMT Paragon của mình với khoảng 1000 đến
4000 chip i860 và nó từng đạt danh hiệu nhanh nhất thế giới vào năm 1993.
Vi xử lí vector là CPU được tích hợp các bộ chỉ dẫn đặc biệt để có thể hoạt động
trong mảng dữ liệu 1 chiều. CPU vector có thể tăng đáng kể hiệu năng ở một số tác vụ
nhất định, đặc biệt là trong lĩnh vực giả lập số hoặc và thực thi các tác vụ giống nhau.
CPU vector phổ biến trong những năm 1970-1980 nhưng ngày nay nó đã gần như biến
mất hoàn toàn.
Hình 2-3 Biểu đồ số lượng core và tốc độ xử lý của siêu máy tính từ tháng 6/1910 đến
tháng 6/2014 (nguồn: phụ lục 5)
Trong 25 năm trở lại đây, tốc độ và khả năng của những SMT đã được nhân lên
hàng triệu lần. Trên đồ thị của hình 2-3, tốc độ xử lý tăng gần gấp đôi qua từng năm từ
năm 2010. Và để đạt được tốc độ xử lý tăng mạnh như vậy thì số lượng bộ vi xử lý được
224,162 186,368
548,352 705,024
1,572,864
560,640
3,120,000 3,120,000 3,120,000
2,331 4,701 8,774 11,280 20,133
27,113
54,902 54,902 54,902
-
10,000
20,000
30,000
40,000
50,000
60,000
2,000
502,000
1,002,000
1,502,000
2,002,000
2,502,000
3,002,000
3,502,000
01
/06
/20
10
01
/08
/20
10
01
/10
/20
10
01
/12
/20
10
01
/02
/20
11
01
/04
/20
11
01
/06
/20
11
01
/08
/20
11
01
/10
/20
11
01
/12
/20
11
01
/02
/20
12
01
/04
/20
12
01
/06
/20
12
01
/08
/20
12
01
/10
/20
12
01
/12
/20
12
01
/02
/20
13
01
/04
/20
13
01
/06
/20
13
01
/08
/20
13
01
/10
/20
13
01
/12
/20
13
01
/02
/20
14
01
/04
/20
14
01
/06
/20
14
Cores Rpeak (TFlop/s)
8
sử dụng cũng tăng với tỉ lệ tương ứng. Tuy nhiên, hiện tại, các định luật vật lý đã bắt đầu
đi đến giới hạn nên việc tăng tốc độ xử lý bằng cách tăng số lương vi xử lý không phải
là một giải pháp khả thi và hiệu quả. So với giai đoạn đầu khi SMT bắt đầu xuất hiện,
ngày nay tốc độ tính toán đã tăng lên rất nhiều. Để dễ so sánh ta sẽ xem một số so sánh
như sau:
Vào đầu những năm thập niên 60 thế kỷ 20, SMT Apollo Guidance Computer của
NASA với bộ nhớ 64 kilobyte, xung nhịp 0,043MHz trong khi con số này trên điện thoại
iPhone 5S hiện nay là 1,5 GHz.
Vào năm 1975, SMT Cray-1 được đánh giá là một SMT mạnh mẽ và có thể “bay”
với tốc độ 80MHz. Mặc dù được sử dụng chính cho mục đích nghiên cứu khoa học,
Cray-1 thực ra đã từng tham gia vào một số công đoạn hoàn thành bộ phim Tron phiên
bản đầu ra mắt năm 1982. Tuy nhiên, Cray-1 chỉ có sức mạnh đạt 80 triệu FLOPS, quá
khiêm tốn khi so sánh với con số 76,8 GFLOPS mà iPhone 5S sở hữu – tức là lớn hơn
gần một nghìn lần. Cray-2 được giới thiệu 10 năm sau Cray-1 và là chiếc máy tính nhanh
nhất thế giới cho tới năm 1990. Dẫu vậy, với con số 1,9 GFLOPS, Cray-2 vẫn xếp sau
rất nhiều so với iPhone 5S, ít nhất là với công cụ đo lường này.
Deep Blue là SMT được biết đến nhiều nhất thông qua thành tích chiến thắng vua
cờ Garry Kasparov. Deep Blue sở hữu thông số 11,38 GFLOPS đồng thời có khả năng
định vị được 200 nghìn vị trí trên bàn cờ mỗi giây. Ngày nay, tức là 17 năm sau đó, chiếc
Samsung Galaxy S5 đã được trang bị thông số GFLOPS ở mức 142 GFLOPS lớn hơn
SMT Deep Blue có được.
Đến ngày hôm nay, SMT dần xuất hiện nhiều hơn và nó cũng có mặt trên nhiều
quốc gia hơn. Hệ điều hành, kiến trúc cũng như phần cứng dùng trong SMT cũng theo
đó thay đổi rất nhiều so với vài chục năm trước.
9
CHƯƠNG 3 : KIẾN TRÚC VÀ PHẦN CỨNG SIÊU
MÁY TÍNH
3.1 Kiến trúc
Cách thức người ta thiết kế SMT đã thay đổi rất nhiều trong thời gian gần đây.
Những chiếc SMT thuở đầu của Seymour Cray hoạt động dựa trên kĩ thuật tính toán
song song và thiết kế nhỏ gọn để có thể đạt được hiệu năng tính toán cao.
Điện toán song song (parellel computing) là khái niệm dùng để chỉ việc sử dụng
một số lượng lớn CPU để thực hiện một bộ các phép tính nào đó. Tất cả các phép tính sẽ
được thực thi song song nhau. Có hai cách mà người ta thường áp dụng:
3.1.1 Kiểu điện toán phân tán
Sử dụng một mạng lưới nhiều máy tính phân tán ở nhiều nơi để xử lí số liệu (grid
computing), và phân tán ở đây có nghĩa là khoảng cách địa lý của chúng tương đối xa
nhau. Thường thì khi một chiếc máy tính trong mạng lưới được chạy lên, nó sẽ ngay lập
tức trở thành một phần của hệ thống tính toán song song, và càng nhiều máy tính tham
gia thì tốc độ xử lí sẽ nhanh hơn. Có một máy chính (Control Node) nằm ở giữa làm
nhiệm vụ điều khiển và phân bổ tác vụ cho các máy con. Có hai cách nhỏ thuộc dạng
này, chúng ta sẽ tìm hiểu thêm ở chương 5.
Hình 3-1 Mô hình kiểu điện toán phân tán
10
3.1.2 Kiểu điện toán tập trung
Sử dụng một lượng lớn CPU đặt gần nhau, và người ta gọi đây là computer cluster
và đây là kiểu điện toán tập trung. Những CPU này thường nằm trong nhiều máy tính
giống nhau, lân cận nhau (gọi là các node, node card hay computer node) và chúng được
kết nối nhằm tạo ra một hệ thống lớn hơn, hoàn chỉnh hơn. Người ta xem cả hệ thống
như một SMT duy nhất. Với biện pháp này, các nhà thiết kế cần đảm bảo rằng tốc độ
cũng như tính linh hoạt nội liên kết giữa các máy tính phải đủ đáp ứng yêu cầu công việc.
Theo số liệu từ TOP500, số SMT cluster hiện chiếm đến 82,2% thị phần SMT toàn cầu.
SMT IBM Blue Gene/Q sử dụng dạng cluster.
Từ các vi xử lí, các nhà sản xuất/cung ứng SMT sẽ tích hợp nó lên một chiếc
"computer card" với RAM và có thể có thêm nhiều linh kiện khác để tạo ra một chiếc
máy tính gần hoàn chỉnh. Nhiều computer card gắn vào một khay, sau đó các khay lại
tiếp được bỏ trong những tủ chứa (rack). Nhiều rack sẽ cấu thành một hệ thống SMT
hoàn chỉnh.
Hình 3-2 Cấu trúc một hệ thống SMT kiểu điện toán tập trung
11
Ngoài ra còn có SMT dạng Massively Parallel Processors (MPP), tức là một máy
tính bự nhưng có hàng nghìn CPU và thanh RAM trong đó. Chúng được nối với nhau
theo một chuẩn mạng đặc biệt tốc độ siêu cao chứ không xài các thứ phổ thông như
cluster. Ngoài ra, mỗi CPU sẽ có bộ nhớ riêng của nó và một bản sao hệ điều hành/ứng
dụng riêng. MPP hiện chiếm 17,8% thị phần SMT, theo TOP500. SMT IBM Blue
Gene/L (đứng thứ 5 thế giới vào năm 2009) được thiết kế dạng MPP.
Hình 3-3 Mô hình SMT dạng Massively Parallel Processors (MPP)
3.2 Phần cứng
Như đã nói ở trên, vào những năm 1970 thì SMT chỉ dùng một số ít bộ xử lý mà
thôi. Nhưng đến những năm 1990, số CPU của nó đã lên đến hàng nghìn và ở thời điểm
hiện tại, số CPU vài triệu là chuyện hết sức bình thường đối với một SMT.
Ở các SMT dạng cluster, người ta thường ghép nhiều "nút" (node) nhỏ lại với
nhau để tạo ra một hệ thống lớn như hình bạn đã thấy ở ngay bên trên. Mỗi một nút như
thế có thể xem là một chiếc máy tính gần như hoàn chỉnh với một hoặc nhiều CPU, GPU,
nhiều thanh RAM, quạt tản nhiệt và một số thành phần khác nữa. Các nút sẽ được kết
nối với nhau theo nhiều cách, có thể là dùng cáp đồng bình thường, cũng có thể là chuyển
sang dùng cáp quang để đảm bảo băng thông tốt hơn. Sức mạnh của SMT sẽ là sức mạnh
tổng hợp từ tất cả các node lại với nhau.
12
Hình 3-4 Kết nối dây trong SMT Titan
Trong các hệ thống SMT, người ta cũng cần đến ổ lưu trữ, và các ổ HDD, SSD
này không nằm trong máy (device attached storage - DAS) như trên PC. Thay vào đó,
chúng thường được bố trí trong một tủ riêng (storage area network - SAN), có kết nối
mạng riêng và dung lượng cũng rất "khủng".
Giờ đây, ngoài CPU đơn thuần, người ta còn sử dụng thêm các GPGPU (general
purpose graphic processor unit) để tăng cường sức mạnh cho SMT. Từ trước đến nay
chúng ta biết GPU được sử dụng để dựng hình ảnh, xử lí những thứ liên quan đến đồ
họa, nhưng ngoài ra chúng còn có thể xử lí số liệu và làm một số công việc tương tự như
CPU. Hiện nay giá thành của các GPGPU đã giảm, hiệu suất lại tăng cao nên ngày càng
nhiều SMT "nhờ vả" vào linh kiện này để tăng sức mạnh nhưng vẫn đảm bảo chi phí
không bị đội lên quá nhiều. SMT mạnh nhất thế giới (tính đến 23/5/2013) mang tên Titan
đặt ở Mỹ cũng dùng 18.688 GPU NVIDIA Tesla K20 bên cạnh 18.688 CPU AMD
Opteron 16 nhân, như vậy tổng số nhân CPU của máy là 299.008, một con số khổng lồ
so với máy tính chỉ 2 hay 4 nhân.
13
Hình 3-5 Một node của SMT Titan
Một node của SMT Titan có 4 CPU AMD Opteron 16 nhân và 4 GPU NVIDIA
Tesla K20 (kiến trúc xây dựng là Kepler). RAM mỗi node là 32GB, cộng với 6GB bộ
nhớ GDDR5 của card đồ họa nữa. Tổng cộng có 710 Terabyte bộ nhớ trong Titan.
Thực chất việc sử dụng GPGPU để tăng cường cho CPU vẫn còn là một vấn đề
đang được các nhà khoa học bàn cãi. Nhiều người cho rằng việc bổ sung GPGPU đúng
là có giúp SMT trở nên mạnh hơn và ghi được điểm benchmark cao hơn, tuy nhiên khi
đưa vào thực tế thì người ta phải bỏ rất rất nhiều công sức tính chỉnh phần mềm để có
thể vắt sạch sức mạnh của kiến trúc kết hợp này.
14
Hình 3-6 Cấu trúc của hãng Cray dùng trong Titan
Cấu trúc của hãng Cray dùng trong Titan là sự kết hợp của cả hai loại Cray XK6
và XE6, trong đó XK6 có hai card NVIDIA đi kèm với RAM bên cạnh CPU AMD
Opteron 64
Châu Âu cũng đang phát triển một dự án SMT dùng CPU Tegra 3 v2 GPU
GeForce. Cụ thể, SMT này xử dụng 256 bộ vi xử lí bốn nhân NVIDIA Tegra 3, 256 bộ
xử lí đồ họa GeForce 520MX và 1TB bộ nhớ RAM DDR3 để hoạt động. Với cấu hình
như thế này, máy có thể tính được 38 teraflops trong một giây nhưng chỉ tốn 1W điện
cho mỗi 7,5 gigaflops. NVIDIA gọi đây là SMT đầu tiên sử dụng CPU của ARM kết
hợp với GPU của hãng. Dự án nghiên cứu, hợp tác xây dựng SMT ở Châu Âu mang tên
Mont-Blanc hứa hẹn sản phẩm này sẽ hoạt động với hiệu suất cao hơn từ bốn đến mười
lần các đối thủ SMT khác vào năm 2014.
15
Hình 3-7 Chi tiết phần cứng CPU Tegra 3 v2 GPU GeForce
Hình 3-8 Cấu trúc SMT dùng CPU Tegra 3 v2 GPU GeForce
3.3 Tản nhiệt, tiêu thụ năng lượng
Qua nhiều thập kỉ, một trong những vấn đề chính với SMT dạng tập trung đó là
việc tiêu thụ năng lượng và tản nhiệt. Mỗi một chiếc SMT ăn một lượng điển khổng lồ,
và phần lớn trong số đó bị chuyển hóa thành nhiệt năng. Khi hệ thống bị quá nhiệt có thể
khiến hiệu suất giảm đi trầm trọng, tuổi thọ các linh kiện cũng bị rút ngắn đáng kể. Các
nhà khoa học đã nghiên cứu nhiều phương án để giải quyết vấn đề này, chẳng hạn như
bơm chất làm mát Flourinert, làm mát bằng chất lỏng, bằng không khí, bằng hệ thống lai
giữa chất lỏng với không khí. Đặc biệt hệ thống lai này được sử dụng phổ biến trong các
SMT được cấu thành từ nhiều tủ chứa. Ngoài ra, một số SMT còn sử dụng vi xử lí năng
lượng thấp để đương đầu với vấn đề nhiệt độ cao như chiếc Blue Gene của IBM. Chiếc
16
IBM Aquasar còn đặc biệt hơn nữa khi nó sử dụng nước nóng để tản nhiệt và dòng nước
đó cũng được dùng để làm ấm cho cả tòa nhà trong mùa lạnh.
SMT Blue Gene của IBM có thể tính toán được 2.10^15 phép tính trong một giây,
tức 2 gigaflop/s trên mỗi Watt điện. Khi mẫu thử Mont-Blanc được hoàn thiện thì nó có
thể đạt mức 7 gigaflop/s trên mỗi Watt, gấp hơn hai lần Blue Gene, và sử dụng khoảng
2.000 - 4.000 bộ xử lí. Thay vì dùng ít vi xử lí nhưng mỗi đơn vị tiêu thụ điện năng quá
lớn, các nhà khoa học sẽ dùng rất nhiều những vi xử lí nhỏ nhưng mức độ tiêu thụ chỉ là
trung bình.
Nếu làm một phép so sánh nhỏ thì chip Tegra 3 có mức tiêu thụ điện vào khoảng
4W, trong khi các CPu Intel Xeon có thể dễ dàng "đốt" 50W đến 100W trong lúc nó hoạt
động. Phần mềm sẽ phải được viết lại để SMT hoạt động được trên GPU mới cũng như
CPU Tegra 3. NVIDIA đã ra mắt một bộ phát triển để những nhà lập trình viết phần
mềm cho SMT của sử dụng các sản phẩm của họ.Thú vị hơn đó là NVIDIA đã bắt đầu
sản xuất những con chip thế hệ kế tiếp của Tegra 3, bao gồm một bộ xử lí 64-bit dựa trên
nhân ARM Cortext A15. Chúng sẽ giúp các SMT hoạt động mạnh mẽ hơn, tính toán
nhanh hơn 4 lần nhưng vẫn tiêu thụ 4W điện cho mỗi CPU.
Hình 3-9 Hệ thống tản nhiệt bằng nước của Titan
17
Nói thêm về lượng điện sử dụng bởi supercomputer, chúng ta có thể lấy dí dụ như
chiếc Tianhe-1A của Trung Quốc có công suất 4,04 megawatt, tức là cơ quan chủ quản
phải chi ra 400 USD/giờ cho tiện điện và tính cả năm là 3,5 triệu USD. Do đó, vấn đề
chi phí khi vận hàng SMT cũng là một bài toán phức tạp.
Để đo hiệu suất sử dụng năng lượng của SMT, người ta sử dụng con số FLOPS
trên Watt và chỉ số này càng cao càng tốt, tức là với mỗi Watt điện thì SMT tính toán
được nhiều phép tính hơn. Năm 2008, chiếc Roadrunner của IBM đạt 376 MFLOPS/W.
Năm 2010, chiếc Blue Gene/Q đạt 1684 MFLOPS/W. Năm 2011, chiếc Blue Gene đặt
tại New York thì đạt 2097 MFLOPS/W.
Và các hang sản xuất SMT đã có nhiều giải pháp để giải quyết vấn đề tiêu thụ
năng lượng và tản nhiệt. Như là IBM áp dụng cho chiếc SMT đầu tiên của hãng có hệ
thống làm mát bằng nước ấm, được lắp đặt tại Viện kỹ thuật liên bang Thụy Sĩ (ETH
Zurich). Có tên là Aquasar, hệ thống này không chỉ tiêu thụ ít năng lượng hơn 40% so
với những máy làm mát bằng không khí, mà nó còn giúp giảm 85% lượng khí thải CO2
khi sử dụng lượng nhiệt thải ra từ máy tính để làm nóng hệ thống sửa ấm của tòa nhà.
Một bộ khung chứa SMT sẽ được làm mát bằng không khí để có thể so sánh trực
tiếp. Bộ khung còn lại sẽ được làm mát bằng các ống chất lỏng lắp đặt trực tiếp trên các
bộ xử lý và một số bộ phận khác bên trong SMT sẽ được làm mát bằng nước ấm (nhiệt
độ nước lên khoảng 60 độ C).
Hình 3-10 Mô hình SMT làm mát bằng nước ấm
18
Nước ấm cho phép các bộ xử lý hoạt động tốt bên dưới ngưỡng nhiệt độ tối đa và
chất làm mát sẽ giúp tản nhiệt hiệu quả hơn gấp 4.000 lần so với hệ thống làm mát bằng
không khí, lượng nhiệt thải ra từ hệ thống SMT sẽ được chuyển sang hệ thống sửa ấm
của tòa nhà. Hệ thống Aquasar đã đóng góp một phần quan trọng trong việc phát triển
các hệ thống SMT hiệu năng cao. Trong tương lai, hiệu quả của một hệ thống máy tính
có thể sẽ được đo bằng mức năng lượng tiêu thụ và lượng khí CO2 mà nó thải ra.
Khi kiểm tra bằng hệ thống benchmark LINPACK, Aquasar đạt mức hiệu năng
là 6 teraflops và mức tiêu hao năng lượng vào khoảng 450megaflops/watt, trong khi vẫn
còn 9 kilowatt nhiệt năng được cung cấp cho hệ thống sưởi của tòa nhà.
19
CHƯƠNG 4 : HỆ ĐIỀU HÀNH VÀ PHẦN MỀM
4.1 Hệ điều hành
Từ đầu thế kỉ 20, hệ điều hành sử dụng trong SMT cũng đã ghi nhận nhiều sự
chuyển biến, tương tự như cách mà kiến trúc supercomputer thay đổi. Những OS đầu
tiên được tùy chỉnh cho từng SMT một để tăng tốc độ, tuy nhiên điều đó rất tốn thời gian,
công sức và tiền bạc. Do đó, trong xu hướng hiện nay, người ra sẽ dùng những OS chung
như Linux cho SMT chứ không còn xài UNIX như những năm 90 nữa. Chúng ta có thể
nhìn vào biểu đồ ngay bên dưới là thấy ngay xu hướng chuyển dịch này.
Hình 4-1 Đồ thị tỉ lệ % các hệ điều hành dùng cho SMT
Trong số 500 SMT nhanh nhất thế giới, Linux là hệ điều hành chiếm số lượng lớn
nhất và việc áp dụng OS nguồn mở này ngày càng được ưa chuộng. Linux đang chiếm
đến 93,8% thị phần SMT. UNIX cũng là hệ điều hành được sử dụng trên nhiều SMT
20
nhưng không phổ biến như Linux và nó đang nắm trong tay 4% thị phần. Windows và
BSD cũng có mặt, tuy nhiên số lượng không đáng kể bởi chúng không đáng tin cậy như
Linux và UNIX, ngoài ra còn có ảnh hưởng bởi chi phí bản quyền nữa. OS X của Apple
trước đây từng được dùng cho SMT nhưng chủ yếu là trong các supercomputer dạng
phân tán.
4.2 Công cụ phần mềm
Vì kiến trúc tính toán song song của SMT, người ta thường phải áp dụng các kĩ
thuật lập trình đặc biệt để khai thác hết sức mạnh của nó. Những công cụ dùng cho việc
này là các hàm API như MPI, PVM, VTL, ngoài ra còn có các giải pháp phần mềm
nguồn mở như EBowulf. Trong hầu hết các trường hợp, môi trường PVM và MPI sẽ
dùng cho các hệ thống dạng cluster, còn OpenMP dùng cho hệ thống có bộ nhớ chia sẻ.
Các thuật toán cũng cần được tối ưu hóa rất nhiều bởi vì SMT không chỉ chạy trên một
mà trên rất rất nhiều CPU, GPU, chưa kể là từng tủ SMT lại nằm riêng với nhau. Các
nhà khoa học cũng phải tính tới việc giảm thiểu đến mức thấp nhất có thể thời gian rỗi
của CPU khi đợi dữ liệu từ node khác chuyển sang. Với các SMT dùng GPGPU, người
ta có thêm các mô hình CUDA của NVIDIA để tăng cường hiệu suất máy.
21
CHƯƠNG 5 : SIÊU MÁY TÍNH KIẾU PHÂN TÁN
Ở dạng phân tán, có hai cách thức để tận dụng nhiều máy tính nhỏ, đó là phương
pháp cơ hội (opportunistic) và phương pháp cận cơ hội (quasi-opportunistic).
5.1 Phương pháp cơ hội - opportunistic
Đây là một dạng của điện toán grid. Trong phương pháp này, một số lượng lớn
máy tính riêng lẻ sẽ tình nguyện phối hợp cùng nhau thành một mạng lưới lớn để thực
thi các tác vụ tính toán cũng khổng lồ không kém. Grid computing đã từng giải quyết
được nhiều vấn đề cần đến điện toán song song, nhưng nó cũng có hạn chế là không tính
được một số tác vụ cổ điển như mô phỏng dòng chảy.
Hình 5-1 Cấu trúc hệ thống điện toán grid kết nối với nhiều máy tính qua internet
Mạng lưới SMT nhanh nhất tính đến tháng 3/2012 đó là Folding@Home (do đại
học Standford phát triển). Nó có sức mạnh 8,1 petaflops và sử dụng các vi xử lí x86.
Trong số đó, 5,8 petaflops được "cống hiến" từ các máy tính với nhiều loại GPU khác
nhau, 1,7 petaflops thì đến từ các máy chơi game PlayStation 3, số còn lại là do nhiều
CPU đóng góp. Hồi năm 2011, thế giới có grid BOINC với sức mạnh 5,5 petaflops góp
từ 480.000 máy tính. Còn trong năm ngoái, Simon Cox đã làm ra một chiếc SMT với 64
chiếc Raspberry Pi's. Hệ thống này mang tên Iridis-Pi và có chi phí chỉ 2500 Bảng Anh
và có bộ nhớ 1TB (16GB thẻ SD cho mỗi chiếc Raspberry Pi).
22
5.2 Phương pháp cận cơ hội - quasi-opportunistic
Điện toán quasi-opportunistic cũng tương tự như điện toán opportunistic, tuy
nhiên nó có chất lượng dịch vụ cao hơn nhờ việc tăng cường kiểm soát các tác vụ mà
mỗi máy đơn lẻ sẽ làm. Nó cũng điều khiển chặt chẽ quá trình sử dụng tài nguyên phân
tán. Kèm theo đó còn có một hệ thống thông minh giúp đảm bảo mức độ hiện diện cũng
như mức độ ổn định của các máy thành viên. Để phương pháp cận cơ hội phát huy hiệu
quả, các máy tính sẽ cần phải có một "hợp đồng phân bổ tài nguyên" kết hợp với nhiều
hình thức liên lạc, chống lỗi phức tạp.
23
CHƯƠNG 6 : ĐO ĐẠC HIỆU NĂNG
6.1 Khả năng và dung lượng
SMT được thiết kế để nhắm việc tính toán các phép tính phức tạp, tức là capability
computing. Điều này có nghĩa là SMT được sử dụng để đưa khả năng tính toán lên mức
tối đa, từ đó giải quyết một vấn đề trong thời gian ngắn nhất có thể. Các phép tính này
rất đặc biệt và nó khó đến nỗi những máy tính bình thường không thể đảm đương được,
ví dụ mô phỏng vụ nổ hạt nhân, dự báo thời tiết, nghiên cứu lượng tử...
Còn nếu muốn xử lí một dung lượng lớn dữ liệu, người ta không dùng SMT mà
dùng một loại máy tính gọi là mainframe. Mainframe có thể đảm nhận được dữ liệu đầu
vào khổng lồ nhưng các phép tính mà nó chạy không phức tạp như SMT. Mainframe chỉ
có thể dùng để giải quyết nhiều vấn đề nhỏ cùng lúc.
6.2 Đo đạc hiệu năng siêu máy tính
Nếu như ở PC, laptop, tablet, smartphone người ta sẽ tiến hành benchmark để biết
được sức mạnh của máy thì trên SMT cũng y như thế. Tuy nhiên, khả năng tính toán của
SMT được đo bằng FLOPS (FLoating Point Operations Per Second - phép tính dấu chấm
động thực hiện trong mỗi giây), trong khi máy tính bình thường thì đo bằng MIPS
(instructions per second - số chỉ dẫn được thực hiện trong mỗi giây). FLOPS có thể được
thêm một số tiếp đầu ngữ trong hệ đo lường SI như tera- (TFLOPS, tức 10^12 FLOPS,
đọc là teraflops), peta (10^15 FLOPS).
Hiện nay các SMT hàng đầu thế giới đều đã bước sang ngưỡng Petaflops, ví dụ
như chiếc IBM Roadrunner năm 2008 là 1,105 Petaflops, Fujitsu K năm 2011 đạt mức
10,51 Petaflops, còn chiếc Cray Titan mạnh nhất hiện nay là 17.59 Petaflops. Người ta
dự đoán là chỉ sau khoảng 10 năm nữa, SMT sẽ sớm bước sang hàng Exaflops (10^18
FLOPS) vì công nghệ của CPU và GPGPU đang tăng trưởng vượt bậc, giá thành lại rẻ
đi và hiệu năng tiêu thụ điện ngày càng được nâng cao.
24
Vậy những con số FLOPS ở đâu ra? Nó được đo bằng một phần mềm tên là
Linpack. Tuy nhiên cũng cần phải nói thêm rằng không một con số đứng riêng lẻ nào có
thể phản ánh toàn bộ hiệu năng của máy tính nói chung và SMT nói riêng. Có hai con số
được thể hiện khi nói tới SMT: hiệu năng tính toán dấu chấm động lý thuyết của vi xử lí
(kí hiệu Rpeak) và hiệu năng xử lí đầu vào (Rmax). Rpeak gần như không thể nào đạt
được trong đời thực, trong khi Rmax là hoàn toàn có thể đạt đến khi SMT chạy. Tất cả
những con số FLOPS bạn thấy ở trên đều là Rmax.
6.3 Danh sách TOP500
Kể từ năm 1993, những SMT nhanh nhất thế giới được liệt kê vào một danh sách
gọi là TOP500 dựa theo điểm số benchmark của nó. TOP500 có trang web riêng của họ
ở địa chỉ http://top500.org và nó cung cấp cho chúng ta rất nhiều thông tin hữu ích. Bên
cạnh việc xem danh sách những SMT hàng đầu thế giới, bạn có thể xem thống kê về việc
phân bổ hệ điều hành trong thế giới SMT như thế nào, số lượng SMT mỗi nước, kiến
trúc SMT (MPP hay cluster)…
Tuy nhiên, vẫn có những quan điểm không đồng ý với cách xếp hạng trên. Ví dụ
như những nhà khoa học ở Đại học Illinois bày tỏ quan ngại rằng công cụ Linpack dùng
để chấm điểm TOP500 không thật sự phản ánh hiệu năng thực tế của SMT, do đó họ
không nộp hồ sơ để đưa của SMT Blue Waters của họ vào TOP500.
Vì vậy danh sách này không hề được đánh giá là chính xác tuyệt đối và không
thiên vị, tuy nhiên nó là một trong những nguồn phổ biến nhất mà người ta thường lấy
khi so sánh sức mạnh SMT ở một thời điểm nào đó.
Thứ
hạng Tên hệ thống Số nhân
Rmax
(TFlop/s)
Rpeak
(TFlop/s)
Công
suất
(kW)
1 Tianhe-2 (MilkyWay-2) 3,120,000 33,862.70 54,902.40 17,808
2 Titan 560,640 17,590.00 27,112.50 8,209
3 Sequoia 1,572,864 17,173.20 20,132.70 7,890
4 K computer 705,024 10,510.00 11,280.40 12,660
5 Mira 786,432 8,586.60 10,066.30 3,945
25
6 Stampede 462,462 5,168.10 8,520.10 4,510
7 JUQUEEN 458,752 5,008.90 5,872.00 2,301
8 Vulcan 393,216 4,293.30 5,033.20 1,972
9 SuperMUC 147,456 2,897.00 3,185.10 3,423
10 Tianhe-1A 186,368 2,566.00 4,701.00 4,040
Bảng 6-1 Danh sách 10 SMT mạnh nhất tháng 6/2014 (nguồn: phụ lục 2)
Trong danh sách TOP500 phiên bản thứ 41 tháng 6 năm 2014, SMT Tianhe-2
(còn gọi là Milky Way-2) của Trung Quốc hiện là SMT mạnh nhất thế giới (phụ lục 4).
Tianhe-2 đã chiếm lấy vị trí dẫn đầu của SMT Titan do Mỹ phát triển theo danh sách
công bố hồi tháng 11 năm 2013. Máy được trang bị 32.000 vi xử lí Intel Xeon E5-2600
v2 dựa trên kiến trúc Ivy Bridge) đi kèm với 48.000 coprocessor Xeon Phi. Cấu hình này
giúp Tianhe-2 có khả năng tính toán với tốc độ 33,85 petaflops, cao gấp đôi so với Titan.
Tianhe-2 không những là SMT mạnh nhất trong TOP500 mà nó còn là một trong
những hệ thống có hiệu suất sử dụng năng lượng tốt nhất với tổng công suất 17,8
megawatt. Tianhe-2 được sử dụng "kiến trúc tân hỗn tạp", trong đó nhiều phần cứng với
các khả năng tính toán khác nhau được truy cập bởi một mô hình lập trình chung. Điều
này giúp đơn giản hóa công đoạn phát triển và tối ưu hóa hệ thống, một lợi thế không có
được với các siêu máy tính sử dụng CPU kết hợp với GPU (như Titan chẳng hạn).
26
CHƯƠNG 7 : ỨNG DỤNG VÀ NHỮNG THÔNG
TIN KHÁC
7.1 Một số ứng dụng của siêu máy tính:
Những ứng dụng của các SMT hàng đầu trên thế giới thường là rất nhạy cảm và
được giữ bí mật trước công chúng vì vậy thông tin về các ứng dụng của SMT rất hạn
chế. Bốn nhóm ứng dụng chính của SMT thường được sử dụng trên thế giới là: vũ khí
hạt nhân, năng lượng, quân sự và những hệ thống máy móc lớn.
Hình 7-1 Ảnh mô phỏng do SMT dựng ra của Cơ quan Khí tượng và Hải dương Mỹ
(NOAA)
Bên cạnh đó, SMT còn được sử dụng để giúp chúng ta thực hiện nhiều công việc
tưởng chừng như không thực hiện được như:
Dự báo thời tiết, nghiên cứu khí động học, nghiên cứu sự biến đổi khí hậu,
mô phỏng động đất
Phân tích xác suất, dựng mô hình phóng xạ, mô phỏng vụ nổ hạt nhân trong
không gian 3D
27
Lượng tử học, phân tử học, sinh học tế bào, nghiên cứu sự gấp khúc của
protein, dựng mô hình lây lan của dịch bệnh
Nghiên cứu và dựng mô hình của các hiện tượng vật lý
Mô phỏng não người, nghiên cứu và mô phỏng trí tuệ nhân tạo
Nghiên cứu thiên văn học, tái tạo vụ nổ Bigbang (do SMT ở trung tâm
Texas Advanced Computing Center thực hiện), nghiên cứu về vật chất tối
Chơi cờ vua! (SMT Deep Blue của IBM từng đánh bại đại kiện tướng
Garry Kasparov vào năm 1997)
Và dưới đây là những ứng dụng cụ thể của các SMT trên thế giới hiện nay:
7.1.1 Siêu máy tính Titan - nghiên cứu về biến đổi khí hậu và nhiên liệu thay thế
Titan là phiên bản nâng cấp từ Jaguar (ra mắt năm 2009 và là SMT mạnh nhất thế
giới ở thời điểm đó). Nhiệm vụ của Titan là phục vụ các nhà nghiên cứu từ các học viện,
phòng thí nghiệm của chính phủ, và các ngành công nghiệp khác nhau để nghiên cứu
những vấn đề như biến đổi khí hậu và các nhiên liệu thay thế. Theo các nhà khoa học,
dự báo về thời tiết có thể chính xác hơn rất nhiều với sự giúp đỡ của SMT Titan.
Hiện tại, có sáu lĩnh vực chủ yếu được nhắm tới để khai thác sức mạnh Titan phục
vụ công tác nghiên cứu:
• Khoa học vật liệu: Chủ yếu để tìm kiếm vật liệu ở cấp độ nguyên tử, hiểu các
thuộc tính của nó. Nó cũng liên quan đến việc tìm ra cách để xây dựng các vật liệu mới
có các đặc tính vượt trội.
• Biến đổi khí hậu: Các nhà nghiên cứu muốn trả lời các câu hỏi về những gì đang
xảy ra, làm thế nào để thay đổi và thích ứng với biến đổi khí hậu.
• Nhiên liệu sinh học: Điều này liên quan đến việc tìm kiếm các loại thực vật,
chẳng hạn như biến một loại cỏ thành ethanol nhờ chất xúc tác enzym (chất xúc tác sinh
học đặc biệt có thành phần cơ bản là protein).
• Năng lượng hạt nhân: Công nghệ này có thể được sử dụng để kích thích lượng
nơtron trong phản ứng tổng hợp và phản ứng phân hạch. Nó cũng bao gồm những dạng
28
năng lượng an toàn hơn và sạch hơn, cũng như nhiên liệu mới sẽ đốt cháy lâu hơn và
sạch hơn.
• Chất đốt: Titan có thể cho phép mô phỏng các quá trình đốt cháy giúp các nhà
nghiên cứu tối ưu hóa nhiên liệu, quy trình và thiết kế động cơ để có được nhiên liệu
cháy sạch hơn.
• Vật lý thiên văn
7.1.2 Siêu máy tính Roadrunner - mô hình hóa sự phân hủy của kho vũ khí hạt
nhân của Mỹ
Năm 2008, chiếc SMT Roadrunner được IBM phát triển ra để mô hình hóa sự
phân hủy của kho vũ khí hạt nhân của Mỹ. Trong suốt 5 năm hoạt động, Roadrunner là
một phần của Cục An ninh hạt nhân quốc gia, đóng vai trò quan trọng trong chương trình
Stockpile Stewardship (một chương trình về nghiên cứu kho hạt nhân). Roadrunner là
một hệ thống mạnh mẽ, đảm nhiệm các công việc tính toán về ngăn chặn hạt nhân, đồng
thời đóng vai trò quan trọng trong các chương trình khoa học khác.
7.1.3 Siêu máy tính Blue Waters - vũ khí mới trong việc ngăn chặn virus HIV
Hiện nay, phương pháp để vô hiệu hóa hoàn toàn virus HIV cũng như loại bỏ khả
năng kháng thuốc của nó vẫn là một câu trả lời khó đối với các nhà khoa học. Giờ đây
chúng ta hầu như đã nắm được mối nguy hiểm của loại virus chưa có thuốc chữa này.
HIV lây nhiễm vào các tế bào quan trọng trong hệ thống miễn dịch của con người như
lympho bào T có tính bổ trợ (cụ thể là những tế bào T - CD4+), đại thực bào và tế bào
tua. Nhiễm HIV làm giảm mạnh số lượng tế bào CD4+ thông qua 3 cơ chế chính: đầu
tiên, virus trực tiếp giết chết các tế bào mà chúng nhiễm vào, sau đó làm tăng tỷ lệ chết
rụng tế bào ở những tế bào bị nhiễm bệnh, bước 3 là các lympho bào T độc (CD8) giết
chết những lympho bào T - CD4+ bị nhiễm bệnh. Khi số lượng các tế bào CD4+ giảm
xuống dưới một mức giới hạn nào đó, sự miễn dịch qua trung gian tế bào bị vô hiệu và
cơ thể dần dần yếu đi tạo điều kiện cho các nhiễm trùng cơ hội. Nhưng nhờ những nỗ
lực của các nhà nghiên cứu tới từ Đại học Pittsburgh, Đại học Illinois và sự hỗ trợ của
29
SMT Blue Waters, chúng ta đã thu được những thành quả nhất định trên con đường ngăn
chặn tận gốc sự phát triển của loại virus nguy hiểm này.
HIV có cấu trúc không giống với các retrovirus khác. Nó có hình cầu với đường
kính khoảng 120 nm, nhỏ hơn khoảng 60 lần so với một tế bào hồng cầu, nhưng đối với
các virus khác thì nó khá lớn. HIV chứa 2 bản sao của ARN chuỗi đơn dương mã hóa 9
gen của virus được bao bọc bởi 1 lớp vỏ (capsid) hình nón bao gồm 2.000 bản sao của
các protein p24. Các RNA sợi đơn được gắn kết với những protein nucleocapsid p7 (phức
hợp bao gồm acid nucleic và vỏ capsid) và những enzyme cần thiết cho sự phát triển của
virus như enzyme phiên mã ngược, enzyme protease, ribonuclease và integrase. Capsid
có trách nhiệm bảo vệ RNA và vô hiệu hóa hệ thống miễn dịch của vật chủ, đồng thời
đưa nó thâm nhập vào tế bào của con người. Một khi lọt vào được bên trong tế bào cơ
thể người, capsid sẽ phân chia để giải phóng các thành phần, giúp virus tái tạo. Nói cách
khác capsid chính là “điểm then chốt” nhằm tìm ra phương thuốc hữu hiệu tận diệt virus
HIV.
Hình 7-2 Cấu trúc virus HIV
30
Cấu trúc virus HIV bao ngoài là một lớp màng lipid kép, dưới màng có gai là các
glycoprotein trọng lượng phân tử 120 kilođanton (KD) ký hiệu là gp120, vỏ protein có
dạng hình cầu gồm các phân tử rotein có trọng lượng phân tử 18KD, p18 và lõi có dạng
hình trụ được bao bọc bằng một lớp protein p24.
Phó giáo sư tiến sĩ Peijun Zhang, trưởng khoa sinh học cấu trúc thuộc Trường Đại
học y khoa Pittsburgh đồng thời là chủ dự án nghiên cứu cấu trúc capsid của virus HIV
cho biết: "Capsid vô cùng quan trọng đối với sự sinh sôi nảy nở của HIV, vì vậy, hiểu rõ
cấu trúc chi tiết của nó có thể giúp chúng ta tạo ra được những dược phẩm mới, có khả
năng chữa trị hoặc ngăn chặn lây nhiễm HIV. Khi xâm nhập vào cơ thể người, caspid
vẫn còn nguyên vẹn để bảo vệ bộ gen HIV, sau đó nó sẽ phân chia để giải phóng các
thành phần, giúp virus tái tạo làm tiền đề cho sự nhân rộng của virus. Phát triển các loại
thuốc gây rối loạn chức năng lớp vỏ bằng cách ngăn chặn lắp ráp hoặc tháo rời có thể
chống lại khả năng sinh sản của virus trong cơ thể người bệnh”.
Hình 7-3 Cấu trúc capsid của virus HIV
31
Tuy nhiên, một thách thức đặt ra là do cấu trúc caspid khá lớn, lại không đối xứng
và không đồng bộ nên các kỹ thuật phổ biến nhằm giải mã cấu trúc này như kính hiển vi
điện tử cryo-electron, chụp cắt lớp cryo-EM, X-quang cấu trúc tinh thể chưa thể thu được
những kết quả tích cực. Điều này vẫn nằm ngoài tầm với của khoa học vì không có đủ
kỹ năng tính toán mô hình hóa cấp độ nguyên tử. Vấn đề này đòi hỏi tới các SMT Blue
Waters. Nhóm nghiên cứu của phó giáo sư Peijun Zhang đã quyết định nhờ tới Trung
tâm ứng dụng SMT của Đại học Illinois tại Urbana-Champaign.
Với sự giúp sức của SMT này, nhóm nghiên cứu đến từ Đại học Pittsburgh đã tạo
nên kỳ tích để tính toán ra cách 1.300 protein kết nối với nhau như thế nào nhằm hình
thành lớp vỏ capsid hình nón. Nhóm nghiên cứu vừa chính thức tiết lộ cấu trúc caspid
hoàn chỉnh của virus HIV trong báo cáo nghiên cứu đăng tải trên tạp chí Nature. Họ cho
rằng, nắm rõ cấu trúc caspid sẽ giúp các nhà khoa học hiểu được cơ chế hoạt động và
làm thế nào có thể tấn công để phá vỡ khả năng nhân rộng của virus.
Hình 7-4 Lớp vỏ capsid hình nón của virus HIV
32
Phó giáo sư Zhang cho rằng: “Tốc độ biến đổi nhanh chóng đã giúp virus HIV có
khả năng kháng thuốc mạnh mẽ. Công trình nghiên cứu của chúng tôi sẽ mở ra triển
vọng về một phương pháp chữa trị có thể thay thế các liệu pháp điều trị HIV phổ biến
hiện nay, vốn hoạt động nhờ tấn công những enzyme nhất định hoặc tách vi rút HIV khỏi
các tế bào ADN , từ đó cho phép hệ miễn dịch của cơ thể tiêu diệt vi rút này”.
7.1.4 Siêu máy tính Watson – siêu máy tính đa năng
Kể từ khi ra đời, Watson được sử dụng cho nhiều mục đích khác nhau ở các lĩnh
vực y tế, bảo hiểm, nghiên cứu tài chính nhờ trí thông minh nhân tạo của mình. SMT
này thậm chí còn xuất hiện trong một số show truyền hình và nó có khả năng thi với
người thật. Ngoài ra IBM phát triển nó thành một dịch vụ đám mây và cũng dùng trong
các lĩnh vực tương tự như trên, ngoài ra còn mở rộng thêm ở mảng truyền thông, giá dục,
du lịch, bán lẻ, ngân hàng, phân tích số liệu kinh doanh
Watson là một hệ thống điện toán giải đáp câu mà được IBM xây dựng và nó áp
dụng các thuật toán xử lí ngôn ngữ tự nhiên, trích xuất thông minh, phát họa kiến thức,
tự động hóa. SMT này bao gồm 90 server IBM Power 750, mỗi server dùng một CPU
POWER7 với tám nhân xử lí 3,5GHz, hỗ trợ bốn luồn tính toán mỗi nhân. Tính tổng
cộng thì Watson sở hữu 2.880 nhân xử lí và RAM 16TB. Máy có khả năng xử lí 500GB
dữ liệu, tương đương 1 triệu quyển sách, trong vòng một giây. Xét về chi phí phần cứng
của Watson thì nó vào khoảng 3 triệu USD. Với sức mạnh 80 TeraFLOP, Watson không
đủ chuẩn nằm trong danh sách top500 SMT mạnh nhất thế giới.
Bên cạnh đó, IBM còn hợp tác với tạp chí ẩm thực Bon Appetit nhằm phát triển
một phần mềm khai thác sức mạnh của SMT Watson nhằm sử dụng cơ sở dữ liệu bao
gồm 9000 công thức nấu ăn của Bon Appetit để hiểu được cách phối ghép các loại
nguyên liệu, phong cách của từng loại thức ăn và làm cách nào để nấu thành một món
ăn hoàn chỉnh. Lượng "kiến thức" trên cho phép Watson đưa ra gợi ý cho người nấu
nhằm tạo ra được món ăn phù hoàn hảo nhất. Với phần mềm trên, người dùng sẽ khai
báo thông tin về các loại nguyên liệu trong món ăn, phong cách của món ăn (kiểu Ý,
33
kiểu châu Á, nhanh hay chậm, dễ hay khó làm,...) Dựa trên các thông tin này kết hợp với
kiến thức nấu ăn học được, Watson sẽ tính toán ra hàng nghìn tỷ cách kết hợp nguyên
liệu và lựa ra 100 món ăn tối ưu được sắp xếp từ thông thường đến phức tạp nhằm cung
cấp cho đầu bếp.
Ngoài việc cung cấp cho các đầu bếp một công cụ hỗ trợ, ứng dụng trên đã cung
cấp một cái nhìn khác về khả năng tính toán của các SMT. Thay vì chỉ đơn giản là thực
hiện các thuật toán hay truy vấn thông tin trong cơ sở dữ liệu, giờ đây Watson còn có thể
nhận thức một cách sâu sắc về những thông tin thu thập được và ứng dụng nó vào thực
tế.
Mặt khác, Watson còn hỗ trợ các bác sĩ tìm ra các phương pháp điều trị thông qua
đưa ra tất cả các biện pháp khả thi. Tuy nhiên, thời gian tới Watson sẽ có khả năng đưa
ra gợi ý về cách thực hiện những phương pháp điều trị nào là tối ưu nhất.
7.1.5 Siêu máy tính Stampede - mô phỏng thời tiết, mô phỏng hành vi con người,
nghiên cứu bản đồ ADN và nghiên cứu không gian
Stampede là kết quả của dự án được tài trợ bởi quĩ khoa học quốc gia Mỹ (NSF),
người ta sẽ dùng SMT này để làm những việc phục vụ khoa học như dự đoán thiên tai
(bão, lụt, động đất, sóng thần, lốc xoáy), mô phỏng các điều kiện thời tiết, mô phỏng
hành vi con người, nghiên cứu bản đồ ADN và nghiên cứu không gian. Ngoài ra
Stampede còn là hệ thống dễ truy cập và lập trình nhất, vì vậy nó sức mạnh của nó sẽ
phục vụ được rất nhiều lĩnh vực nghiên cứu như nghiên cứu môi trường, không gian lẫn
y khoa.
7.1.6 Siêu máy tính ASTRON - xử lý dữ liệu kính thiên văn radio lớn nhất thế giới
ASTRON, một Học viện về Thiên văn học Radio ở Hà Lan hợp tác trị giá 43 triệu
USD và kéo dài 5 năm với hãng máy tính IBM để cùng nhau xây dựng một hệ thống
SMT Exascale trước năm 2024, mục đích là dùng để chạy Square Kilometer Array
(SKA), một dự án xây dựng kính thiên văn radio lớn nhất thế giới kéo dài suốt 3.000 km
ở vùng đất Nam Phi hoặc Úc, trị giá 2,1 tỷ USD. SKA sẽ chính thức đi vào hoạt động
34
vào năm 2024 và nó sẽ thu thập một lượng dữ liệu tương đương 1 Exabyte mỗi ngày, và
nó cần có một SMT có sức mạnh tương đương để xử lý hết số dữ liệu đó. 1 Exabyte (EB)
tương đương 1 tỷ GB (1 Exabyte EB = 1.000 Petabyte = 1.000.000 Terabyte =
1.000.000.000 Gigabyte).
Người ta hy vọng kính thiên văn của dự án SKA sẽ mạnh gấp 50 lần các đĩa vệ
tinh hiện nay của con người, cho phép chúng ta có thể nhìn đến những nơi xa xôi nhất
của vũ trụ và nghiên cứu về nguồn gốc của nó cách đây 13 tỷ năm. Các nhà khoa học
cho biết khi SKA đi vào hoạt động, lượng dữ liệu mà nó thu thập mỗi ngày sẽ tương
đương 1 Exabyte, nhiều gấp 2 lần lượng dữ liệu được truyền tải mỗi ngày trên Internet.
Tất nhiên, hiện nay không có bất kỳ hệ thống máy tính nào có thể đảm đương
công việc này cả. Đó là lý do tại sao ASTRON và IBM phải cùng nhau phát triển một hệ
thống SMT mới mang tên Exascale. Các hệ thống SMT mạnh nhất hiện nay mà chúng
ta đang có thuộc dạng Petascale, nghĩa là có khả năng xử lý hàng triệu tỷ phép tính mỗi
giây. Máy tính Exascale sẽ mạnh hơn máy tính Petascale gấp 1.000 lần. Nếu không có
máy tính Exascale, người ta sẽ phải ghép hàng triệu chiếc máy tính mạnh nhất hiện nay
lại với nhau mới có thể vận hành kính thiên văn SKA. Từ nay đến lúc đó, IBM sẽ phải
dùng đến các công nghệ mới nhất hiện nay như Nanophotonics (Nano-optics), công nghệ
ghép chồng chip 3D và bộ nhớ chuyển pha cùng với nhiều công nghệ khác để xây dựng
thành máy tính Exascale.
7.1.7 Siêu máy tính Advanced Supercomputing HQ - dự báo thời tiết của NASA
Hàng tuần, NASA sử dụng hệ thống SMT NASA Advanced Supercomputing HQ
để thực hiện kế hoạch NEX (NASA Earth Exchange) của mình. Hệ thống SMT đặt tại
Ames Research ở California có 56.832 nhân xử lý, khả năng lưu trữ 1,4 petabyte và 128
màn hình giúp các nhà khoa học theo dõi những thay đổi về khí hậu trên toàn thế giới.
Với hệ thống này, cá nhà khoa học sẽ có thể tạo nên những mô hình và thu thập được
nhiều hình ảnh của các vùng đất khác nhau thông qua các hình mẫu, hệ thống thời tiết
và 1 số các nguyên tố sinh thái học khác.
35
Sử dụng NEX, các nhà khoa học của NASA có thể xử lý những bức hình có độ
phân giải 500 tỳ pixel thu thập trong vòng 30 năm qua về sự thay đổi hoa màu toàn cầu
chỉ trong vòng 10 tiếng. Nếu không có NEX, chúng ta phải tốn rất nhiều thời gian để xử
lý những số liệu này trong khi kết quả lại không được chia sẻ cho tất cả mọi người. Thêm
vào đó, vì NEX sẽ được cung cấp 1 cách rộng rãi nên dữ liệu của nó sẽ được phổ biến
cho tất cả người dùng. NEX làm giảm bớt sự ganh đua của các nhà khoa học trên toàn
thế giới, làm cho họ giúp đỡ nhau nhiều hơn để cùng phát triển.
7.1.8 Siêu máy tính Sequoia - mô hình quản lý vũ khí hạt nhân
Sequoia được phát triển dựa trên hệ thống 96-rack IBM Blue Gene/Q với mục
đích được sử dụng cho mô hình quản lý vũ khí hạt nhân. Bên cạnh khả năng chạy nhanh
hơn, Sequoia cũng tiêu thụ ít điện năng hơn so với SMT khác. Cụ thể là hệ thống của
IBM chỉ sử dụng 7,9 megawatt điện năng.
Sequoia sẽ cung cấp một sự hiểu biết đầy đủ hơn về hiệu năng của vũ khí hạt
nhân, đặc biệt trong thủy động lực học và tính chất vật liệu ở áp suất và nhiệt độ cao.
Đặc biệt, hệ thống sẽ cho phép tính toán định lượng giải quyết sự không chắc chắn cho
các nỗ lực kéo dài tuổi thọ các hệ thống vũ khí, những gì mà chúng ta gọi là chương trình
mở rộng cuộc sống (LEP). Hệ thống cho phép nhanh chóng sàng lọc các con số dữ liệu
lớn, cố gắng tìm ra độ ổn định và sự chắc chắn liên quan đến các thiết bị hạt nhân.
Nhà nghiên cứu Joseph Nichols (thuộc Trung tâm nghiên cứu Turbulence tại
Trường Stanford) đã sử dụng Sequoia IBM Bluegene/Q - hệ thống thuộc Phòng thí
nghiệm quốc gia Lawrence Livermore – để giải quyết vấn đề liên quan đến thủy động
lực học rất phức tạp để dự đoán và xử lý tiếng ồn động cơ máy bay phản lực siêu thanh.
Sức mạnh phối hợp của hơn 1 triệu bộ lõi máy tính này sẽ giúp thiết kế loại động cơ ít
tiếng ồn hơn. Theo Giáo sư Parviz Moin, việc tính toán mô phỏng thủy động lực học
giống như cách giải quyết của Joseph Nichols là vô cùng phức tạp. Các mô phỏng cho
phép tạo ra mô hình, đo lường tiến trình đã và đang xảy ra trong môi trường khí thải khắc
nghiệt của máy bay phản lực mà các thiết bị thông thường không tiếp cận được.
36
7.1.9 Siêu máy tính Condor - phân tích và xử lý hình ảnh của không lực Italia
Các loại SMT luôn rất đắt bất kể nó dùng để làm gì thế nhưng nếu ghép một nhiều
máy PS3 lại với nhau, chi phí sẽ rẻ hơn tới 10 lần so với bình thường. Dự án Chim kền
kền (Condor Project) dành riêng cho việc phân tích và xử lý hình ảnh của không lực
Italia hoàn toàn thực hiện theo nguyên tắc này. Được làm từ 1716 máy PS3 kết hợp với
nhau, SMT Condor được coi là một trong top 50 chiếc máy tính mạnh nhất thế giới năm
2011.
Lực lượng không quân Italia hy vọng rằng SMT Condor sẽ giải quyết hoàn toàn
vấn đề xử lý hình ảnh từ trên không trung của họ vì máy PS3 tỏ ra cực kỳ ấn tượng trong
lĩnh vực này. Với tất cả vệ tinh họ đang có, việc chụp hàng nghìn tấm ảnh không phải là
chuyện khó khăn. Điều làm tất cả ấn tượng với Condor đó là người sử dụng có thể di
chuyển camera xung quanh như thể bạn đang chơi StarCraft và có thể tua đi tua lại dựa
vào lượng thông tin đang có.
Việc phát triển Condor đã bắt đầu không lâu sau khi Sony tung ra máy PS3 trên
thị trường. Richard W.Linderman, một khoa học gia của phòng thí nghiệm Rome đã mua
thử một chiếc và tiến hành thử nghiệm. Họ dã tiến hành thử nghiệm nối 8 máy lại với
nhau xem chúng có thể làm được gì. Quá ấn tượng, họ quyết định nâng con số lên 336.
Kết quả nhận được còn tuyệt vời hơn nữa. Vậy thì hơn 1000 chiếc sẽ cho ra kết quả đến
thế nào nữa? Phòng thí nghiệm Rome đã quyết định sử dụng 1700 máy PS3. Với chi phí
rẻ hơn nhiều so với các SMT hiện hành nhưng sức mạnh tương đương, máy Condor của
Không quân Italia đã ghi dấu ấn về sự sáng tạo và thông minh.
7.1.10 Siêu máy tính The Dawn - mô phỏng các vụ nổ hạt nhân
SMT The Dawn (loại máy IBM BlueGene P) được đặt tại Terascale Simulation
Facility - Trung tâm Mô phỏng máy tính thuộc Phòng thí nghiệm Quốc gia Lawrence
Livermore. Nó được sử dụng để mô phỏng các vụ nổ hạt nhân để kiểm tra, kiểm soát và
thử nghiệm vũ khí hạt nhân được xây dựng dựa trên những dữ liệu, thông số thiết kế
thực tế của quả bom nhập vào bộ nhớ máy tính. Chương trình được thiết kế và chế tạo
37
bởi phòng thí nghiệm Livermore vào những năm cuối Chiến tranh lạnh. Đây là bước đột
phá lớn thời đó, vì lần đầu tiên con người có thể phát hiện sớm một sai sót kỹ thuật trong
quả bom. Và nhờ bước đột phá này, các nhà khoa học đã có thể hiểu biết một cách căn
bản hơn về cơ chế hoạt động của quả bom so với những gì những nhà khoa học có thể
hình dung trong các vụ nổ thử trước đây
Để tiến hành việc mô phỏng hoạt động của quả bom trên SMT, một nhóm các nhà
khoa học và thiết kế vũ khí của Mỹ đã cùng nhau kiểm tra một danh mục tất cả các điều
kiện có khả năng tác động đến quả bom hạt nhân. Ở đây, các nhà khoa học Mỹ sử dụng
quả bom chiến lược B-83 làm đối tượng mô phỏng trong chương trình SMT. B-83 là quả
bom hiện đại nhất đồng thời là một trong những vũ khí tối tân nhất trong kho vũ khí của
Mỹ hiện nay. Nó được chế tạo trong thời gian nước Mỹ đã ngưng hoàn toàn các vụ nổ
thử trong thực tế, vì vậy chương trình SMT được triển khai để thử nghiệm, kiểm tra,
kiểm soát cường độ, độ an toàn và tất cả các đặc tính khác của quả bom này. Khi thực
hiện mô phỏng kiểm tra tính an toàn và độ tin cậy trong quá trình phóng, các nhà khoa
học và thiết kế đã kiểm tra các yếu tố tác động đến quả bom như nhiệt độ, độ cao, chấn
rung và các yếu tố khác có khả năng tác động đến quả bom trong quá trình bay đến mục
tiêu.
Trước khi có chương trình SMT, việc kiểm tra thường được tiến hành bằng cách
tách rời các bộ phận (đầu đạn và thân bom), kiểm tra, thử nghiệm bằng các phương pháp
hóa học, vật lý, toán học, vật liệu học và một số lý thuyết khác; đồng thời đối chiếu, so
sánh với các số liệu nổ thử bom hạt nhân trước đó. Với SMT, các nhà khoa học không
cần phải nhọc công làm các bước kiểm tra "thủ công" mà chỉ cần mô phỏng các vụ nổ,
các kiểm nghiệm kỹ thuật bằng chương trình máy tính.
Các nhà khoa học tại các phòng thí nghiệm được trang bị các SMT mạnh nhất
hành tinh đã đi sâu nghiên cứu bí ẩn của tiến trình phân hạch khi vụ nổ xảy ra. Chính
những nghiên cứu này đã giúp làm sáng tỏ nhiều điều mà trước năm 1992 - thời điểm
38
Mỹ chấm dứt hoàn toàn các vụ nổ thử bom hạt nhân - người Mỹ đã không thể hiểu hết
được.
Với những kết quả nghiên cứu trên, Nhà Trắng tự tin tuyên bố rằng, với những
tiến bộ về công nghệ thông tin, nước Mỹ sẽ không cần phải tiến hành trở lại những vụ
nổ thử bom hạt nhân như trước nữa mà vẫn có thể thử nghiệm và kiểm tra hoàn chỉnh
những quả bom mới được chế tạo. Bởi vì, chương trình mô phỏng trên SMT không chỉ
dự báo trước những vấn đề trục trặc có thể phát sinh, giảm thiểu những rủi ro tác động
xấu đến kho vũ khí của Mỹ, mà còn tiến hành nổ thử bom hạt nhân.
7.2 Một số hãng sản xuất và cung cấp siêu máy tính
Bạn có thể thấy là IBM, HP và Cray là ba công ty dẫn đầu trên lĩnh vực SMT hiện
nay. Dell, Intel, NEC, Lenovo, Acer, Fujitsu, Oracle cũng có tham gia vào lĩnh vực này.
Hình 7-5 Biểu đồ tỉ lệ % số lượng máy tính do các công ty sản xuất SMT
7.3 Các nước có siêu máy tính
STT Quốc gia Số
lượng
Tỉ lệ
(%)
Rmax
(GFlops)
Rpeak
(GFlops) Cores
1 United States 232 46.4 122,452,336 175,406,632 9,617,949
39
2 China 76 15.2 52,129,821 102,670,220 5,432,584
3 United Kingdom 30 6 14,871,213 18,458,733 925,152
4 Japan 30 6 23,941,240 31,005,691 1,654,398
5 France 27 5.4 11,236,985 13,234,047 776,468
6 Germany 22 4.4 14,809,560 17,611,601 1,113,012
7 Canada 9 1.8 1,959,750 2,393,414 165,280
8 India 9 1.8 2,898,745 3,521,915 169,324
9 Korea, South 8 1.6 2,112,514 3,202,991 211,080
10 Australia 6 1.2 2,472,259 2,869,878 151,072
Bảng 7-1 Danh sách 10 quốc gia có số lượng SMT lớn nhất tháng 6/2014 (nguồn: phụ
lục 3)
Hình 7-6 Biểu đồ tỉ lệ % số lượng SMT của các nước trên thế giới tháng 6/2014
(nguồn: phụ lục 3)
Nhìn trên hình 7-6, Mỹ là nước chiếm gần phân nửa số lượng SMT trong top500
trên thế giới. Và theo sao là sự tăng trưởng mạnh mẽ của Trung Quốc trong lĩnh vực
SMT. Và hiện tại, Trung Quốc đang là nước có SMT mạnh nhất thế giới (phụ lục 2).
41
CHƯƠNG 8 : XU HƯỚNG NGHIÊN CỨU VÀ PHÁT
TRIỂN
8.1 Xu hướng phát triển sức mạnh xử lý của siêu máy tính
Tổ chức chứng nhận top 500 SMT mạnh nhất Thế giới cho biết tốc độ xuất hiện
những SMT mới đang dần bị chậm lại, hiện nay phải hơn 1 năm thì mới xuất hiện một
SMT đủ sức giành vị trí mạnh nhất, chậm hơn khá nhiều so với trước đây. Tianhe-2 (hay
còn có tên khác là Milky Way 2), một SMT của Trung Quốc, có năng lực xử lý 33,86
petaflops/giây đã liên tục nắm vị trí mạnh nhất Thế giới 3 kì liên tiếp, từ lần tổng kết
tháng 6/2013, tháng 11/2013 và mới đây là kì 6/2014.
SMT Tianhe-2 sử dụng CPU Intel Xeon E5-2692 với 12 nhân và Xeon Phi 31SP,
nền tảng Ivy Bridge, vốn có năng lực xử lý tối đa trên lý thuyết là 54,9 petaflops/giây,
hiện tại nó đang được sử dụng ở mức 33,86 petaflops/giây. Vào 6 năm trước, tháng
6/2008 thì IBM đã tạo nên Roadrunner, chiếc SMT đầu tiên đạt năng lực xử lý
petaflops/giây, và nó cũng giữ vị trí đầu bảng suốt 3 kì liền, từ 6/2008 tới 6/2009.
Trong top 10 hiện nay, chỉ có 1 SMT mới xuất hiện, là Cray XC30 của chính phủ
Mỹ, năng lực xử lý 3,14 petaflops/giây. Các SMT hiện nay đang hướng tới sức mạnh xử
lý tầm exascale, với 1 exascale mạnh hơn 1 petaflop tới 1000 lần. Tuy nhiên, các yếu tố
khác cũng không thể bỏ qua đó là tính hiệu quả về điện năng tiêu thụ, cũng như sự cân
nhắc về hiệu năng/giá thành của hệ thống.
8.2 Kiến trúc mới và tiết kiệm năng lượng tiêu thụ
“Các SMT trong tương lai sẽ phải cân nhắc nhiều hơn nữa tính tiết kiệm năng
lượng. Đồng thời, trong tương lai, chúng ta cũng phải tìm ra các giải pháp mới để xử lý
và lưu trữ những lượng dữ liệu khổng lồ liên quan đến các công việc tính toán lớn như
vậy” theo phòng thí nghiệm Los Alamos.
42
8.2.1 Siêu máy tính nền tảng ARM
Vi xử lý ARM là con chip được dùng hầu hết trên smartphone và máy tính bảng
hiện nay, và nó đang bắt đầu thu hút được các công ty trong việc trang bị cho các máy
chủ. Trong tương lai, nếu áp dụng thành công, các trung tâm dữ liệu hứa hẹn sẽ tiết kiệm
được rất nhiều điện năng, trong khi vẫn đủ đảm bảo sức mạnh xử lý. Hiện tại, Dell cũng
là hãng đã cung cấp các prototype máy chủ ARM tầm thấp đến tầm trung cho khách
hàng của mình.
Hiện nay, các siêu máy tính mạnh nhất thế giới đều sử dụng vi xử lý x86 do Intel,
AMD sản xuất; hoặc vi xử lý Power của IBM; Sparc của Oracle. Chip ARM được đánh
giá là không đủ mạnh để dùng cho siêu máy tính, là các SMT vốn được dùng cho các
công việc tính toán phức tạp. Điều này giống như trước đây với vi xử lý đồ họa. Nếu như
trước đây, chip đồ họa không giữ nhiều vai trò trong SMT, nhưng cho tới nay thì chúng
lại rất cần thiết, quan trọng không kém CPU. Vì vậy chip ARM từ trước tới nay chưa
bao giờ là đối thủ của x86 trong lĩnh vực SMT, nhưng điều này có thể sẽ thay đổi trong
tương lai.
Nhiều hãng sản xuất bắt đầu nghiên cứu dùng vi xử lý ARM để xây dựng SMT
trong tương lai. Hiện tại, Dell hiện đang tiến hành nghiên cứu các bản prototype SMT
dùng vi xử lý ARM để có thể triển khai loại SMT này trong tương lai. Hay trung tâm
SMT Barcelona (Barcelona Supercomputing Center) cũng là một trong các tổ chức tiên
phong trong việc áp dụng vi xử lý ARM cho SMT. Barcelona Supercomputing Center
đang sản xuất một bản prototype SMT dùng vi xử lý 2 nhân Exynos 5 của Samsung.
Với SMT dùng vi xử lý ARM tiết kiệm điện năng sẽ là một giải pháp cho bài toán
năng lượng tiêu thụ của SMT hiện nay. Tuy nhiên, sẽ có thể phải mất một thời gian nữa
để ARM được cộng đồng nghiên cứu chấp nhận. Các phần mềm được viết ra hiện nay
vẫn chưa có ý định nhắm tới server ARM, và các nhà nghiên cứu thường có xu hướng
viết phần mềm hướng tới các nền tảng cũ đã ổn định. ARM, x86, và Power là các vi xử
lý chạy trên các kiến trúc khác nhau và hỗ trợ các nền tảng code khác nhau.
43
8.2.2 Siêu máy tính The Machine
The Machine là một SMT trong tương lai với sức mạnh có thể hoàn toàn thay thế
được những trung tâm dự liệu khổng lồ hiện nay nhưng lại có kích thước chỉ bằng 1
chiếc tủ lạnh dân dụng thông thường. Hiện tại dự án đang được phát triển bởi phòng thí
nghiệm của HP.
Hình 8-1 Martin Fink, giám đốc công nghệ của HP và hình ảnh bộ vi xử lý của The
Machine
Về cơ bản, The Machine sở hữu các bộ vi xử lý với thiết kế kiến trúc hoàn toàn
mới nhằm thực hiện nhiệm vụ xử lý cùng lúc một lượng dữ liệu khổng lồ. The Machine
được trang bị cụm vi xử lý đa nhiệm hướng đối tượng chuyên dụng thay vì các vi xử lý
phổ biến như hiện nay. Đồng thời, SMT sử dụng hệ thống truyền tải dữ liệu bằng ánh
sáng thay cho các sợi dây đồng vốn chậm chạp, tiêu thụ nhiều năng lượng và sẽ lỗi thời
trong tương lai. Đồng thời, thay vì sử dụng bộ nhớ RAM như hiện nay, The Machine sử
dụng bộ nhớ điện trở memristor nhằm cải thiện khả năng lưu trữ, xử lý thông tin lên gấp
nhiều lần so với hiện tại.
44
The Machine có thể cùng lúc xử lý lượng dữ liệu khổng lồ trong thời gian cực kỳ
nhanh chóng nhưng chỉ tiêu thụ một lượng nhỏ điện năng. Với The Machine, vấn đề
năng lượng tiêu thụ sẽ hầu như biến mất tại các trung tâm dữ liệu. Theo số liệu từ HP,
The Machine có thể định vị 160 petabytes dữ liệu trong vòng 250 nano giây.
Hình 8-2 Martin Fink cùng với mô đun bộ nhớ của The Machine
Như vậy, The Machine mạnh hơn tới 6 lần so với các thế hệ máy chủ hiện tại và
đồng thời, lại có mức tiêu thụ điện năng thấp hơn 80 lần. Với các khả năng trên, The
Machine không chỉ được dùng làm Trung tâm dữ liệu hay SMT mà còn có thể cải tiến
thu nhỏ kích thước nhằm phù hợp với máy tính xách tay hay thậm chí là điện thoại di
động.
Đối với HP, nền tảng trên đã mở ra cánh cửa thực phát triển những mô hình máy
tính vô cùng mạnh mẽ dường như không tưởng ở thời điểm hiện tại. Nếu dự án thành
công sẽ góp phần thay đổi diện mạo không chỉ của giới công nghệ mà còn thúc đẩy sự
phát triển của nhiều lĩnh vực khác. Một bác sĩ có thể so sánh các triệu chứng của 1 bệnh
45
nhân với hàng triệu bệnh án khác từ khắp nơi trên thế giới nhằm đưa ra biện pháp điều
trị tốt hơn.
Các nhà khoa học cũng có thể tận dụng sức mạnh của The Machine nhằm phục
vụ cho công tác nghiên cứu với cơ sở dữ liệu vô cùng lớn và đòi hỏi hàng loạt các thuật
toán phức tạp. Đây chỉ là 1 trong rất nhiều ứng dụng mà cỗ SMT của HP có thể mang lại
cho con người. Trong tương lai, HP đang lên kế hoạch phát triển một hệ điều hành dành
riêng cho The Machine. Và hơn nữa, sẽ có một phiên bản Android được tối ưu hóa cho
phép người dùng có thể truy cập và khai thác The Machine thông qua các thiết bị di động
cá nhân để phục vụ cho nhu cầu cần thiết.
8.2.3 Siêu máy tính quang học
Nhỏ gọn mạnh mẽ và thân thiện với môi trường, SMT quang học đang được phát
triển bởi Optalysys hứa hẹn sẽ sớm đạt được tốc độ xử lý lên đến hàng nghìn triệu triệu
phép tính một giây (exaflops). Trước đây, công ty này đã cho ra một bản thử nghiệm
máy tính quang chạy với tốc độ 346 gigaflops, tuy chưa nhanh bằng những SMT tính
tiên tiến hiện nay, nhưng nó cho thấy một tương lai đầy hứa hẹn cho công nghệ máy tính
mới này. Dự kiến SMT quang học này sẽ ra mắt vào năm 2020
Công nghệ mới này sử dụng các hiệu ứng quang học để tính toán thay vì cách sử
dụng transitor thường thấy. Một luồng laze mật độ thấp sẽ được chiếu qua các lớp lưới
tinh thể lỏng, các lớp này làm thay đổi mật độ luồng laze dựa trên dữ liệu đầu vào. Kết
quả thu được sau khi phân tích mô hình giao thoa của luồng laze sẽ được sử dụng để giải
các phương trình và thi hành các tác vụ khác. Mặt khác, nhờ khả năng phân chia luồng
laze đi qua nhiều lớp lưới khác nhau, máy tính quang học trên lý thuyết đáp ứng khả
năng tính toán song song hiệu quả hơn nhiều so với khả năng đa xử lý thông thường của
các siêu máy tính hiện nay.
46
Hình 8-3 Mô hình hiệu ứng quang học được áp dụng cho SMT trong tương lai
Hệ thống máy tính mới cũng sử dụng rất ít năng lượng. So các siêu máy tính vận
hành khác, hệ thống có khả năng tính toán đạt mức exaflops này chỉ mất vài ngàn đôla
cho một năm hoạt động, trong khi siêu máy tính đầu bảng Tinanhe-2 ngốn đến hàng triệu
đôla và khả năng mới dừng lại mức petaflops. Optalysys dự tính sẽ thiết kế hai sản phẩm
sau khi ra mắt mẫu thử nghiệm: bộ vi xử lý quang học “big data” hoạt động tương thích
với các siêu máy tính hiện tại và siêu máy tính quang học hoạt động độc lập. Các sản
phẩm sẽ được dự tính thương mại hóa vào năm 2017 với tốc độ 9 petaflop và đạt mức
tối đa 17.1 exaflop (tương đương 17.100 petaflop) vào năm 2020. Hiện tại, siêu máy tính
nhanh nhất thế giới Tianhe-2 mới chỉ đạt mức tính toán 34 petaflop. Các con số ấn tượng
hiện tại vẫn chỉ dừng lại trên giấy, tuy nhiên chũng ta có quyền hy vọng vào tính khả thi
của công nghệ mới này khi một mẫu thử nghiệm nữa ra mắt vào tháng 1 năm 2015.
8.2.4 Siêu máy tính lượng tử
Nguyên tắc cơ bản của SMT lượng tử được hiểu là "sự chồng lượng tử", nghĩa là
một vật thể tồn tại cùng lúc ở nhiều trạng thái khác nhau. Máy tính truyền thống sử dụng
47
các bit thông tin nhị phân riêng biệt (chuỗi liên tục các giá trị 1 hoặc 0); trong khi máy
tính lượng tử sử dụng các bit lượng tử - gọi là qubit - tức đồng thời là các chuỗi giá trị 0
và 1, hay nói cách khác là sự chồng lên các trạng thái khác nhau của hệ lượng tử.
Máy tính lượng tử có khả năng thực hiện cùng lúc hàng ngàn phép tính khác nhau
do đó nó có thể giải quyết vấn đề nhanh hơn gấp nhiều lần máy tính truyền thống hiện
nay. Công nghệ lượng tử giúp tăng cường tốc độ xử lý cũng như khả năng bảo mật thông
tin cho máy tính bằng cách sử dụng sức mạnh của các nguyên tử và phân tử. Máy tính
lượng tử đặc biệt hữu ích khi được sử dụng để xử lý những vấn đề với lượng dữ liệu
khổng lồ.
Từ trước đến nay, khái niệm máy tính lượng tử vẫn còn nằm trên lý thuyết và
nhiều nhà khoa học không tin có thể biến nó thành hiện thực. Nhưng, với những tiến bộ
công nghệ vượt bậc ngày nay người ta cho rằng thời đại của máy tính lượng tử có lẽ đang
đến gần. Với máy tính lượng tử, dữ liệu không được xử lý bằng transistor (bán dẫn) nữa
mà bằng các nguyên tử gọi là "quantum bit" hay "qubit".
Hiện tại, các chuyên gia chưa dự đoán được khi nào SMT lượng tử có thể được
đưa vào sử dụng. Đầu thế kỷ 21, một số chuyên gia cho rằng việc phát triển một siêu
máy tính như thế có lẽ sẽ thành hiện thực từ 10 đến 100 năm nữa.
8.3 Và sức mạnh của siêu máy tính không chỉ là tăng tốc độ xử lý
Trong tương lai, sức mạnh của siêu máy tính không chỉ là tốc độ xử lý. Theo các
chuyên gia dự báo, đến năm 2018, SMT có thể xử lý thông tin giống như não bộ của con
người. Vào khoảng năm 2020, tốc độ xử lý sẽ đạt đến mức exaflop (1 tỉ tỉ phép tính trên
giây), gấp khoảng 1000 lần SMT hiện tại. Và trong khoảng 2025 đến 2045, SMT sẽ bắt
đầu có khả năng tự nhận thức.
Với việc SMT đang dần tiến đến giới hạn của công nghệ, các nhà khoa học đang
tìm cách để thu nhỏ bộ xử lý, kết hợp với sức mạnh công nghệ mới và tìm kiếm những
nguồn năng lượng mới nhằm làm cho SMT hoạt động hiệu quả hơn. Với những nỗ lực
48
này sẽ có thể khám phá ra một công nghệ mới mà chứng ta chưa biết đến như là việc
phát minh ra SMT vào những năm đầu thập niên 20.
49
TÀI LIỆU THAM KHẢO
1. Thái Hùng Văn, 2014, Giáo trình môn Kiến trúc máy tính và hợp ngữ
2. Trang web xếp hạng danh sách 500 SMT hàng đầu trên thế giới www.top500.org
3. Wikipedia, Supercomputer,
http://en.wikipedia.org/wiki/Supercomputer#Distributed_supercomputing truy cập
ngày 1/9/2014
4. CHLOE ALBANESIUS, Infographic: 70 Years of Supercomputers,
http://www.pcmag.com/article2/0,2817,2390970,00.asp truy cập ngày 1/9/2014
5. Wikipedia, IBM Roadrunner, http://en.wikipedia.org/wiki/IBM_Roadrunner truy
cập ngày 1/9/2014
6. Caitlin Fairchild, INFOGRAPHIC: SUPERCOMPUTERS AND THEIR
SUPERPOWERS, http://www.nextgov.com/big-data/2014/08/infographic-
supercomputers/91103/ truy cập ngày 1/9/2014
7. Dusan Belic, A supercomputer in your pocket [infographic]
http://www.intomobile.com/2013/09/25/supercomputer-your-pocket-infographic/
truy cập ngày 1/9/2014
8. GRAYSON, World’s 10 Fastest Supercomputers [Infographic],
http://dailyinfographic.com/worlds-10-fastest-supercomputers-infographic truy cập
ngày 1/9/2014
9. Trí Thức Trẻ, iPhone 5S mạnh hơn cả siêu máy tính NASA từng sử dụng,
http://kenh14.vn/2-tek/iphone-5s-manh-hon-ca-sieu-may-tinh-nasa-tung-su-dung-
20140616053942667.chn truy cập ngày 1/9/2014
10. Duy Luân, Tìm hiểu cơ bản về siêu máy tính, những cỗ máy phức tạp và mạnh mẽ,
http://www.tinhte.vn/threads/tim-hieu-co-ban-ve-sieu-may-tinh-nhung-co-may-
phuc-tap-va-manh-me.2106936/ truy cập ngày 1/9/2014
50
11. Trí Thức Trẻ, Điểm danh 10 siêu máy tính mạnh nhất thế giới, http://kenh14.vn/2-
tek/diem-danh-10-sieu-may-tinh-manh-nhat-the-gioi-201371221287924.chn truy
cập ngày 1/9/2014
12. Genk, Những sự thật thú vị có thể bạn chưa biết về siêu máy tính, http://genk.vn/pc-
do-choi-so/nhung-su-that-thu-vi-co-the-ban-chua-biet-ve-sieu-may-tinh-
20120627053959670.chn truy cập ngày 1/9/2014
13. Genk, Siêu máy tính Roadrunner lừng lẫy một thời ngừng hoạt động,
http://genk.vn/pc-do-choi-so/sieu-may-tinh-roadrunner-lung-lay-mot-thoi-ngung-
hoat-dong-20130401094531705.chn truy cập ngày 1/9/2014
14. Tinhte, Siêu máy tính Blue Waters đi vào hoạt động 24/7,
http://www.tinhte.vn/threads/sieu-may-tinh-blue-waters-di-vao-hoat-dong-24-7-
362-240-nhan-cpu-ram-1-382-petabyte.2024063/ truy cập ngày 1/9/2014
15. Genk, Dell nghiên cứu siêu máy tính nền tảng ARM, http://genk.vn/pc-do-choi-
so/dell-nghien-cuu-sieu-may-tinh-nen-tang-arm-20130330071422181.chn
16. Genk, Siêu máy tính Blue Waters - vũ khí mới trong công cuộc ngăn chặn virus HIV,
http://genk.vn/do-choi-so/sieu-may-tinh-blue-waters-vu-khi-moi-trong-cong-cuoc-
ngan-chan-virus-hiv-20130609122858415.chn truy cập ngày 1/9/2014
17. Tinhte, IBM phát triển phần mềm sử dụng sức mạnh của siêu máy tính Watson để
hỗ trợ người dùng nấu ăn, http://www.tinhte.vn/threads/ibm-phat-trien-phan-mem-
su-dung-suc-manh-cua-sieu-may-tinh-watson-de-ho-tro-nguoi-dung-nau-
an.2321413/ truy cập ngày 1/9/2014
18. Tinhte, HP tiết lộ dự án phát triển công nghệ máy tính của tương lai với tên gọi The
Machine, http://www.tinhte.vn/threads/hp-tiet-lo-du-an-phat-trien-cong-nghe-may-
tinh-cua-tuong-lai-voi-ten-goi-the-machine.2312587/ truy cập ngày 1/9/2014
19. Tinhte, Mont-Blanc, dự án siêu máy tính mạnh nhất, tiết kiệm điện nhất dùng chip
ARM, http://www.tinhte.vn/threads/mont-blanc-du-an-sieu-may-tinh-manh-nhat-
tiet-kiem-dien-nhat-dung-chip-arm.1180499/ truy cập ngày 1/9/2014
51
20. Tinhte, IBM tham gia xây dựng siêu máy tính Exascale phục vụ thiên văn học,
http://www.tinhte.vn/threads/ibm-tham-gia-xay-dung-sieu-may-tinh-exascale-
phuc-vu-thien-van-hoc.1178775/ truy cập ngày 1/9/2014
21. Tinhte, Châu Âu nhắm đến siêu máy tính dùng CPU Tegra3 và GPU Geforce,
http://www.tinhte.vn/threads/chau-au-nham-den-sieu-may-tinh-dung-cpu-tegra3-
va-gpu-geforce.935610/ truy cập ngày 1/9/2014
22. Tinhte, IBM ra mắt siêu máy tính làm mát bằng nước ấm,
http://www.tinhte.vn/threads/ibm-ra-mat-sieu-may-tinh-lam-mat-bang-nuoc-
am.438914/ truy cập ngày 1/9/2014
23. Tinhte, Siêu máy tính Advanced Supercomputing HQ dự báo thời tiết của NASA,
http://www.tinhte.vn/threads/sieu-may-tinh-advanced-supercomputing-hq-du-bao-
thoi-tiet-cua-nasa.396646/ truy cập ngày 1/9/2014
24. Tinhte, Máy tính lượng tử là gì và con người đã phát triển công nghệ này đến đâu?,
http://www.tinhte.vn/threads/may-tinh-luong-tu-la-gi-va-con-nguoi-da-phat-trien-
cong-nghe-nay-den-dau.2318643/ truy cập ngày 1/9/2014
52
PHỤ LỤC
Phụ lục 1: Lịch sử phát triển của các siêu máy tính
1. Control Data Corporation (CDC) 6600 - 1964
CDC 6600.
CDC 6600 sở hữu kích thước khá khiêm tốn – bằng khoảng bốn tủ đựng hồ sơ cỡ
trung bình. Tổng giá trị của SMT này là 8 triệu USD (tương đương 60 triệu USD ở thời
giá hiện nay). “SMT” đầu tiên của thế giới chỉ được trang bị một CPU duy nhất với tốc
độ 40MHz, khả năng tính toán tối đa ở mức 3 megaflops.
Trở lại thời điểm năm 1964, mẫu máy nhanh nhất trên thị trường lúc bấy giờ là
IBM Stretch, với diện tích mặt sàn gần 200 mét vuông và mức giá bán khoảng 13 triệu
USD. CDC 6600 ra mắt với kích thước nhỏ gọn hơn, mức giá chỉ bằng 60% trong khi
tốc độ xử lý cao gấp 10 lần. Đó chính là lý do vì sao CDC 6600 lại trở thành sản phẩm
đầu tiên được phong danh hiệu “SMT”.
53
Nói về cấu trúc vận hành, CDC 6600 đã đi trước thời đại của mình hàng chục
năm. Bộ xử lý trung tâm của mẫu máy này gồm 10 đơn vị chức năng vận hành cùng lúc,
mỗi đơn vị phụ trách những tác vụ cụ thể như: Thực hiện phép cộng, thực hiện phép chia.
Bên cạnh đó, CDC 6600 còn có thêm 10 bộ xử lý ngoại vi nhằm duy trì hiệu suất
hoạt động luôn ở mức tối đa. SMT này cũng sở hữu một cơ chế tản nhiệt rất hiệu quả,
hợp thành bởi các ống luân chuyển chất Freon chạy dọc hệ thống nối liền với một nguồn
cấp nước lạnh đặt bên ngoài.
2. Cray 1 - 1976
Cray 1.
54
Sử dụng mạch tích hợp trên nền tảng 64-bit và hoạt động ở tốc độ 80 MHz, hiệu
năng tính toán của Cray 1 có thể đạt mức 136 megaflops, bước đột phá so với con số 3
megaflops của CDC 6600. Tổng cộng, SMT này bao gồm 1662 bảng mạch và 144 IC;
toàn hệ thống được làm mát bởi cơ chế tản nhiệt bằng chất Freon lỏng.
Cray 1 sở hữu một thiết kế hết sức đặc biệt: Những mô đun xử lý tốc độ cao được
đặt gần phần thân máy hơn, nhằm tối thiểu hóa độ dài dây dẫn. Nhờ vậy, quá trình truyền
tải dữ liệu ổn định, thời gian hoạt động giữa của các mô đun được căn chỉnh hợp lý, dẫn
tới tốc độ xử lý cao hơn.
Xuất phát điểm là một SMT chuyên giả lập các mô hình vũ khí hạt nhân tại Phòng
thí nghiệm quốc gia của Mĩ tại Los Alamos, thật bất ngờ khi Cray 1 sau này trở thành
một trong những SMT thành công nhất xét trên khía cạnh thương mại, với hơn 80 đơn
vị sản phẩm được bán ra trong 7 năm (1976- 1982). Mức giá “vừa phải” (từ 5 – 8 triệu
USD) là nguyên nhân chính giải thích cho mức độ “đắt hàng” của mẫu máy này.
3. Cray X-MP - 1982
55
Cray X-MP.
Cho đến thời điểm đầu những năm 80 của thế kỉ trước, trong khi hầu hết các SMT
vẫn chỉ sử dụng một CPU duy nhất. Cray X-MP đã tạo ra bước ngoặt với 4 CPU trong
cùng một khung máy. Các CPU này có cấu trúc tương tự với CPU của Cray 1; song nhờ
tốc độ xung nhịp cao hơn (105 MHz) và băng thông bộ nhớ tăng gấp đôi, tốc độ xử lý
của từng CPU riêng biệt có thể đạt mức 200 megaflops. Với tổng khả năng xử lý lên tới
800 megaflops, Cray X-MP xứng đáng với mức giá 15 triệu USD của mình (khoảng 32
triệu USD ở thời giá hiện nay).
Một điểm đáng chú ý khác của Cray X-MP là khả năng lưu trữ ấn tượng. Mẫu
máy này sở hữu 32 đơn vị lưu trữ, với kích thước mỗi đơn vị tương đương một chiếc tủ
nhỏ và khả năng lưu trữ tối đa lên tới 1,2 GB dữ liệu. Chi phí cho mỗi GB dữ liệu được
ước tính vào khoảng … 225 nghìn USD, bù lại tốc độ truyền tải của X-MP có thể đạt
10MB/s – rất ấn tượng trong thời đại mà đĩa mềm còn là phương tiện lưu trữ thông tin
phổ biến.
56
4. Cray 2 - 1985
Cray 2.
Cũng giống như Cray 1 và Cray X-MP, Cray 2 tiếp tục sử dụng hệ thống mạch
tích hợp bao bọc trong phần khung máy hình móng ngựa. Bên trong thân máy, các bảng
mạch được sắp xếp rất khít nhau nhằm tận dụng không gian đến mức tối đa; do đó, cơ
chế tản nhiệt sử dụng chất Freon lỏng không còn hữu dụng, mà được thay thế bởi hệ
thống làm mát bằng hơi Flourinert.
57
Với hiệu năng được cải thiện đáng kể và 8 CPU hoạt động cùng lúc, trong quá
trình thiết kế Cray 2, Cray Research phải đối mặt với hiện tượng thắt cổ chai nghiêm
trọng trong băng thông bộ nhớ. Để giải quyết vấn đề này, hãng đã sử dụng các vi xử lý
bề mặt (foreground chip) để tải thông tin từ bộ nhớ chính về các vùng nhớ địa phương
thông qua các mạng dữ liệu có băng thông gigabit/giây, sau đó mới đưa chỉ dẫn đến các
vi xử lý nền (background chip) làm nhiệm vụ tính toán.
Đột phá trong cơ chế hoạt động cho phép Cray 2 đạt tốc độ xử lý tối đa lên tới 1,9
gigaflops - nhanh gấp đôi Cray X-MP và trở thành mẫu máy tính nhanh nhất thế giới cho
đến năm 1990. Trái ngược với các SMT Cray khác (chỉ được sử dụng trong các cơ quan
trực thuộc Chính phủ Mĩ), có thể bắt gặp Cray 2 trong trung tâm máy chủ của nhiều
trường đại học và tổ chức tư nhân.
5. Làn sóng Nhật Bản – nửa đầu thập niên 90
Hitachi SR2201.
58
Sau 20 năm thống trị thị trường của nước Mĩ, những năm đầu thập niên 90 chứng
kiến sự bành trường của một thế lực mới: các SMT đến từ Nhật Bản. Những đại diện
tiêu biểu cho làn sóng này có thể kể đến NEC SX-3, Fujitsu Numerical Wind Tunnel hay
Hitachi SR2201.
Sử dụng cấu trúc tương tự dòng máy Cray, những SMT này gồm nhiều vi xử lý
hoạt động song song cùng với bộ nhớ truy cập nhanh, và lần lượt trở thành các mẫu máy
tính nhanh nhất thế giới vào thời của chúng. Lấy ví dụ về Hitachi SR2201, mẫu máy này
được ra mắt vào năm 1996, với 2048 vi xử lý và hiệu năng tính toán tối đa đạt 600
gigaflops.
Cũng trong khoảng thời gian này, bắt đầu xuất hiện xu hướng chuyển từ một mạng
thông tin duy nhất tiến tới điện toán song song, khi hàng trăm thậm chí hàng ngàn CPU
được kết nối và hoạt động cùng lúc. Đó cũng là nền tảng để công nghệ vi xử lý đa lõi
phát triển sau này.
6. Intel – nửa cuối thập niên 90
ASCI Red.
59
Vì sao Intel – ông vua của thị trường vi xử lý từ những năm 70 lại chưa một lần
được nhắc đến trong các mẫu SMT cho đến tận thời điểm này? Lý do chính dẫn đến thực
tế trên là các đặc điểm đối nghịch giữa SMT và máy tính cá nhân. Trong khi một bên đặt
khả năng xử lý lên hàng đầu; bên còn lại bị giới hạn bởi nhiều yếu tố: chi phí, năng lượng
và cả độ nóng. Intel tập trung phát triển vi xử lý cho PC, vậy nên cũng dễ hiểu khi thị
trường SMT không dành cho họ.
Sau nhiều thử nghiệm thất bại, vào năm 1996, Intel cho ra mắt ASCI Red – SMT
đầu tiên cấu thành từ các loại vi xử lý đã được thương mại hóa. Sở hữu 6000 vi xử lý
Pentium Pros ở tốc độ 200 MHz, ASCI Red là SMT đầu tiên vượt qua ngưỡng 1 teraflop
(1 triệu tỷ phép tính mỗi giây). Sau này, ASCI Red tiếp tục được nâng cấp với 9298 vi
xử lý Pentium II Xeon, đạt mức 3,1 teraflops. SMT này giữ vững danh hiệu là SMT
mạnh nhất thế giới trong 4 năm liền, và là mẫu máy đầu tiên vượt qua ngưỡng 1 megawatt
điện năng tiêu thụ.
7. Beowulf Cluster – kỷ nguyên SMT … tự chế
Ví dụ về một hệ thống Beowulf Cluster.
60
Thành công của Intel như một lời khẳng định: Có thể sử dụng các loại vi xử lý đã
được thương mại hóa để sản xuất SMT. Từ đó, trào lưu “tự chế” SMT bắt đầu nổ ra. Nói
là “SMT” thì hơi phóng đại, vì thực chất Beowulf Cluster chỉ là hệ thống các máy tính
làm việc song song với nhau. Hệ thống này chia các phép toán phức tạp thành các tác vụ
nhỏ, sau đó phân công cho các máy con để xử lý đồng thời.
Thành phần cơ bản để xây dựng một hệ thống Beowulf cluster là những máy tính
cá nhân sử dụng phần mềm mã nguồn mở. Cũng chính từ trào lưu này, Linux nổi lên như
một hệ điều hành phổ biến cho các SMT. Các Beowulf Cluster có những đóng góp quan
trọng trong nhiều lĩnh vực. Lấy ví dụ, Toy Story - bộ phim hoạt hình với doanh thu 360
triệu USD - đã được sản xuất từ một hệ thống như vậy.
8. IBM – những năm đầu thế kỉ 21
Một bảng mạch của Blue Gene/L với mật độ nút mạng dày đặc.
Sau thời kỳ thống trị của Intel với ASCI Red và ASCI White, đến năm 2002, với
chi phí sản xuất 900 triệu USD và hiệu năng xử lý lên tới 35 teraflops, NEC Earth
61
Simulator giành lại ngôi vị máy tính mạnh nhất thế giới về tay Nhật Bản. Tuy nhiên, chỉ
2 năm sau, gã khổng lồ công nghệ IBM cho ra mắt SMT Blue Gene/L, mở màn cho một
series SMT “không có đối thủ” cho đến tận năm 2008.
Phiên bản đầu tiên của Blue Gene/L sở hữu 16000 nút mạng (mỗi nút gồm 2 CPU)
và đạt hiệu năng 70 teraflops. Phiên bản cuối cùng – ra mắt năm 2007 – bao gồm trên
100000 nút mạng và mức hiệu năng được đẩy lên 600 teraflops. IBM không công khai
tổng chi phí của các SMT này, nhưng nhiều nhận định cho rằng đây là một dự án tiêu
tốn nhiều tỉ USD.
Blue Gene/L là một SMT đặc biệt vì hai lý do. Thứ nhất, thay vì sử dụng các vi
xử lý mạnh mẽ nhưng tốn nhiều điện năng, mẫu máy này được cấu thành từ các chip
RSC Power PC với hiệu suất sử dụng năng lượng rất cao. Thứ hai, các nút mạng được
sắp xếp với mật độ khủng khiếp, nhưng không cần đến sự trợ giúp của bất kỳ loại tản
nhiệt nước hay hơi nào.
Blue Gene/L là máy tính mạnh nhất thế giới trong một khoảng thời gian dài, cho
đến năm 2008, khi nó bị vượt qua bởi một sản phẩm khác của IBM – SMT Roadrunner
với hiệu năng xử lý vượt qua ngưỡng … 1 petaflops (1 triệu tỷ phép tính trên giây).
9. Trung Quốc – từ năm 2010
Tianhe-1A.
62
Bước vào thế kỉ XXI, Trung Quốc đạt được những bước tiến mạnh mẽ trong mọi
lĩnh vực, bao gồm cả công nghệ sản xuất phần cứng; nhưng phải đợi đến năm 2010, quốc
gia đông dân nhất thế giới này mới lần đầu tiên lên “đỉnh” ở phân khúc SMT với Tianhe-
1A. Mẫu máy này sở hữu 14336 CPU Intel Xeon X5670 và 6168 GPU Nvidia Tesla, đạt
hiệu năng xử lý tối đa lên tới 2,5 petaflops.
Tuy nhiên, với chủ trương giảm dần sự lệ thuộc vào nguồn công nghệ nước ngoài,
thành tựu lớn nhất mà Trung Quốc đạt được cho đến thời điểm hiện tại chính là sự ra đời
của SMT Sunway. SMT này có khả năng tính toán thấp hơn Tianhe-1A, “chỉ” 1 petaflops,
nhưng 100% vi xử lý của máy mang thương hiệu bản địa Shenwei. Sunway giống như
một lời khẳng định: Trung Quốc đang dần bắt kịp và có khả năng tạo ra những sản phẩm
công nghệ cao không thua kém các quốc gia phương Tây.
10. Hiện tại và tương lai
Fujitsu's K.
Ngôi vị mẫu máy tính mạnh nhất thế giới ở thời điểm hiện tại đang thuộc về Nhật
Bản với SMT Fujitsu’s K. Mẫu máy này được cấu thành từ 88128 vi xử lý 8 lõi SD ARC
64, mỗi vi xử lý địa phương được trang bị 16 GB RAM; nhờ đó mức hiệu năng xử lý tối
đa lên tới 10 petaflops. Fujitsu’s K nắm giữ nhiều kỉ lục khác: SMT có mức điện năng
63
tiêu thụ cao nhất - 10 Megawatt (gấp 5 lần mức sản lượng của … thủy điện Hòa Bình),
SMT có giá trị lớn nhất – 100 tỷ yên Nhật (1,25 tỷ USD).
Mục tiêu tiếp theo trong cuộc đua sức mạnh SMT sẽ là mức hiệu năng tính toán
exaflops – 1 exaflop tương ứng với 1 tỷ tỷ phép toán trong một giây. Một số dự án đã
được khởi động, như Square Kilometre Array – SMT phân tích dữ liệu thiên văn của
IBM. Với tốc độ tăng trưởng hiện tại, nhiều dự báo cho rằng giới hạn trên sẽ bị vượt qua
vào khoảng năm 2018 – 2020.
64
Phụ lục 2: Danh sách các siêu máy tính mạnh mẽ nhất thế giới năm 2014
Danh sách những chiếc SMT mạnh mẽ nhất năm 2014, từ đó phần nào thấy được
tốc độ phát triển đến chóng mặt của công nghệ máy tính và sự đua tranh của các nước
tiên tiến trong lĩnh vực này.
1. Tianhe-2 (Trung Quốc)
Đứng ở vị trí quán quân trong bảng xếp hạng các SMT nhanh nhất thế giới là phiên bản
nâng cấp của Tianhe-1A, chiếc Tianhe-2. SMT đến từ Trung Quốc này có tốc độ ấn
tượng lên tới 33,86 petaflops với hệ thống kết cấu gồm đến 3.12 triệu nhân. Trong một
số điều kiện thuận lợi nhất định, thậm chí siêu máy này có thể đạt đến tốc độ khủng khiếp
hơn vào khoảng 54,9 petaflops.
2. Titan (Hoa Kỳ)
65
Là một phiên bản nâng cấp so với người tiền nhiệm của mình mang tên Jaguar, Titan có
tốc độ 17,6 petaflops, sử dụng Cray CPU và Nvidia GPU cùng 560.640 nhân. Chiếc
SMT này mới được đưa vào vận hành hoàn thiện từ đầu năm nay và chủ yếu hoạt động
trong các lĩnh vực vật lí phân tử quy mô, dựng mô hình khí hậu, phản ứng tổng hợp laser
và năng lượng.
3. Sequoia (Hoa Kỳ)
66
Sequoia là thành quả của IBM sau một thời gian dài nghiên cứu và bắt đầu được đưa vào
vận hành từ tháng Bảy năm 2012. Với tốc độ cực khủng vào cỡ 17,2 petaflops, SMT này
cần đến 1,6 triệu nhân xử lý. Sequoia được Hoa Kỳ tận dụng trong các lĩnh vực thử
nghiệm kích thích vũ khí hạt nhân, động lực học chất lỏng, các nghiên cứu sâu về thiên
văn, năng lượng, bộ gene người và biến đổi khí hậu.
4. K Computer (Nhật Bản)
67
K Computer là chiếc SMT đến từ đất nước mặt trời mọc, nó hoạt động dựa trên hệ thống
phân phối bộ nhớ gồm khoảng hơn 80.000 máy tính tiêng biệt, tốc độ đạt 10,8 petaflops,
705.024 nhân Sparc và công nghệ đa kết nối sáu chiều Tofu. K Computer chủ yếu phục
vụ cho việc tính toán các số liệu về năng lượng, tính bền vững, chăm sóc sức khỏe, biến
đổi khí hậu, các thách thức thuộc nghiên cứu vũ trụ...
5. Mira (Hoa Kỳ)
68
Còn có tên gọi khác là "IBM Mira", Mira là chiếc SMT petascale phát triển trên công
nghệ Blue Gene/Q. Máy có đến 787.432 nhân với tốc độ 8,6 petaflops. Mira ra đời để
phục vụ cho nghiên cứu thuộc các lĩnh vực khoa học vật liệu, địa chấn học, khí hậu và
hóa học. SMT này chính là câu trả lời của Mỹ trước sự ra đời của máy tính Trung Quốc
Tianhe-1A với mức chi phí để phát triển được ước tính vào khoảng 180 triệu USD.
6. Stampede (Hoa Kỳ)
69
Vận hành bởi Trung tâm điện toán tiên tiến thuộc trường Đại học Texas, Stampede tận
dụng sức mạnh của các vi xử lý Xenon cùng công nghệ đa kết nối InfiniBand với tốc độ
ước tính vào khoảng 5,2 petaflops. Từ khi ra đời đến nay, SMT này đã thực hiện thành
công khoảng 450.000 phép tính phức tạp về các vấn đề như bản đồ địa chấn, lập mô hình
băng để nghiên cứu biến đổi khí hậu, nâng cao chất lượng hình ảnh các khối u trong
não...
7. Juqueen (Đức)
70
Là thế hệ tiếp nối của SMT Jugene, Juqueen được phát triển dựa trên công nghệ Blue
Gene/Q với tốc độ 5 petaflops. Juqueen có nhiệm vụ chính là thực hiện các phép tính
phức tạp trong các lĩnh vực khoa học thần kinh, thuật toán sinh học, năng lượng, nghiên
cứu khí hậu và vật lí lượng tử. Với 458.752 nhân xử lí và lượng điện tiêu thụ 2.301
kilowatt, Juqueen là hệ thống SMT tiết kiệm năng lượng nhất thế giới.
8. Vulcan (Hoa Kỳ)
71
Được đặt tại Phòng nghiên cứu Quốc gia Lawrence Livermore, California, Vulcan ra đời
phục vụ cho hoạt động của cả chính phủ, các ngành công nghiệp quốc gia và nghiên cứu
ở các trường đại học. Vulcan sở hữu sức mạnh của 393.216 nhân xử lý với tốc độ đạt 4,3
petaflops. Chiếc SMT này được phát triển dựa trên công nghệ Blue Gene/Q của IBM,
nó bao gồm 24 kệ máy và 24.576 điểm máy tính riêng biệt.
9. SuperMUC (Đức)
72
SuperMUC là tên chiếc SMT mới nhất của Trung tân Siêu điện toán Leibniz, Đức. Hiện
SuperMUC đang hoạt động dựa trên hệ thống máy chủ IBM iDataPlex với 300TB RAM
và công nghệ siêu kết nối InfiniBand đảm bảo việc 147.456 nhân xử lý có thể hoạt động
đồng nhất và đạt công suất 2,9 petaflops. Được biết, để đảm bảo tối giản chi phí hoạt
động, các kĩ sư ở đây đã sử dụng một phương pháp làm mát khá đặc biệt cho SuperMUC.
Cụ thể, họ giảm nhiệt cho SMT bằng cách trực tiếp sử dụng nước ở nhiệt độ khoảng 40
độ C.
10. Tianhe-1A (Trung Quốc)
73
Dịch ra tiếng Việt có nghĩa là “Thiên Hà 1”, Tianhe-1A là một trong số ít những chiếc
SMT thuộc dạng petascale hiện đang hoạt động trên thế giới. Theo đó, Tianhe-1A có khả
năng chạy được ở tốc độ 2.6 petaflops (2,6 tỷ phép tính mỗi giây). Chiếc SMT này vận
hành trên hệ điều hành được phát triển theo nền tảng Linux và nó tận dụng sức mạnh kết
hợp của của Intel Xenon CPU và Nvidia GPU xuyên suốt 183.368 nhân xử lý. Hiện chiếc
SMT Tianhe-1A đang được đặt tại Trung tâm Siêu điện toán quốc gia tại Thiên Tân,
Trung Quốc với trách nhiệm xử lý các phép tính cho việc khai thác dầu khí và thiết kế
công nghiệp vũ trụ.
74
Phụ lục 3: Danh sách các nước có siêu máy tính trong top500 tháng 6/2014
STT Quốc gia Số
lượng
Tỉ lệ
(%)
Rmax
(GFlops)
Rpeak
(GFlops) Cores
1 United States 232 46.4 122,452,336 175,406,632 9,617,949
2 China 76 15.2 52,129,821 102,670,220 5,432,584
3 United Kingdom 30 6 14,871,213 18,458,733 925,152
4 Japan 30 6 23,941,240 31,005,691 1,654,398
5 France 27 5.4 11,236,985 13,234,047 776,468
6 Germany 22 4.4 14,809,560 17,611,601 1,113,012
7 Canada 9 1.8 1,959,750 2,393,414 165,280
8 India 9 1.8 2,898,745 3,521,915 169,324
9 Korea, South 8 1.6 2,112,514 3,202,991 211,080
10 Australia 6 1.2 2,472,259 2,869,878 151,072
11 Switzerland 6 1.2 7,959,572 9,847,816 263,888
12 Netherlands 5 1 1,005,527 1,381,992 62,160
13 Russia 5 1 2,046,483 3,438,216 159,828
14 Italy 5 1 5,537,409 7,055,617 268,400
15 Brazil 4 0.8 1,031,365 1,594,904 76,080
16 Saudi Arabia 4 0.8 1,981,894 2,744,515 169,232
17 Norway 3 0.6 735,400 873,164 54,400
18 Sweden 3 0.6 812,531 991,193 73,248
19 Belgium 2 0.4 319,821 393,256 19,944
20 Israel 2 0.4 347,685 860,954 41,392
21 Finland 2 0.4 378,000 436,301 20,976
75
22 Poland 2 0.4 455,909 583,605 41,852
23 Spain 2 0.4 1,199,031 1,357,824 65,280
24 Denmark 1 0.2 162,098 183,676 15,672
25 Taiwan 1 0.2 177,100 231,859 26,244
26 Malaysia 1 0.2 201,941 401,600 20,080
27 Hong Kong 1 0.2 234,248 476,928 25,920
28 Ireland 1 0.2 140,446 147,456 7,680
29 Austria 1 0.2 152,900 182,829 20,776
76
Phụ lục 4: Danh sách top10 siêu máy tính đứng đầu trong top500 tháng 6/2014
Th
ứ h
ạn
g
Địa điểm Tên hệ thống S
ố n
hân
Rm
ax
(TF
lop
/s)
Rp
eak
(TF
lop
/s)
Cô
ng
suất (k
W)
1
Đại học Quốc
gia Công nghệ
Quốc phòng,
Trung Quốc
Tianhe-2 (MilkyWay-2) - TH-IVB-FEP
Cluster, Intel Xeon E5-2692 12C
2.200 GHz, TH Express-2, Intel Xeon
Phi 31S1P,
Nhà sản xuất: NUDT
3,1
20
,00
0
33
,86
2.7
0
54
,90
2.4
0
17
,80
8
2
DOE / SC /
Phòng thí
nghiệm quốc
gia Oak Ridge,
Hoa Kỳ
Titan - Cray XK7, Opteron 6274 16C
2.200 GHz, Cray Gemini interconnect,
NVIDIA K20x,
Nhà sản xuất: Cray Inc.
56
0,6
40
17
,59
0.0
0
27
,11
2.5
0
8,2
09
3 DOE/NNSA/L
LNL, Hoa Kỳ
Sequoia - BlueGene/Q, Power BQC 16C
1.60 GHz, Custom,
Nhà sản xuất: IBM
1,5
72,8
64
17
,173
.20
20
,132
.70
7,8
90
4
Viện Khoa học
Tính toán nâng
cao RIKEN
(AICS), Nhật
Bản
K computer, SPARC64 VIIIfx 2.0 GHz,
Tofu interconnect,
Nhà sản xuất: Fujitsu
705,0
24
10,5
10
.00
11,2
80
.40
12,6
60
77
5
DOE/SC/Argo
nne National
Laboratory,
Hoa Kỳ
Mira - BlueGene/Q, Power BQC 16C
1.60 GHz, Custom,
Nhà sản xuất: IBM 786,4
32
8,5
86.6
0
10,0
66.3
0
3,9
45
6
Texas
Advanced
Computing
Center/Univ.
of Texas, Hoa
Kỳ
Stampede - PowerEdge C8220, Xeon
E5-2680 8C 2.700 GHz, Infiniband
FDR, Intel Xeon Phi SE10P,
Nhà sản xuất: Dell
46
2,4
62
5,1
68
.10
8,5
20
.10
4,5
10
7
Forschungszen
trum Juelich
(FZJ), Đức
JUQUEEN - BlueGene/Q, Power BQC
16C 1.600 GHz, Custom Interconnect,
Nhà sản xuất: IBM
45
8,7
52
5,0
08
.90
5,8
72
.00
2,3
01
8 DOE/NNSA/L
LNL, Hoa Kỳ
Vulcan - BlueGene/Q, Power BQC 16C
1.600 GHz, Custom Interconnect,
Nhà sản xuất: IBM
39
3,2
16
4,2
93
.30
5,0
33
.20
1,9
72
9
Leibniz
Rechenzentru
m, Đức
SuperMUC - iDataPlex DX360M4,
Xeon E5-2680 8C 2.70 GHz, Infiniband
FDR,
Nhà sản xuất: IBM
147
,456
2,8
97
.00
3,1
85
.10
3,4
23
10
National
Supercomputi
ng Center in
Tianjin, Trung
Quốc
Tianhe-1A - NUDT YH MPP, Xeon
X5670 6C 2.93 GHz, NVIDIA 2050,
Nhà sản xuất: NUDT
186
,36
8
2,5
66.0
0
4,7
01.0
0
4,0
40
78
Phụ lục 5: Danh sách các siêu máy tính đứng đầu top500 từ tháng 6/1993 đến tháng
6/2014
List
Site System C
ores
Rm
ax
(TF
lop
/s)
Rp
eak
(TF
lop
/s)
Po
wer (k
W)
01
/06
/20
14
National Super
Computer Center
in Guangzhou
China
Tianhe-2 (MilkyWay-2) -
TH-IVB-FEP Cluster, Intel
Xeon E5-2692 12C
2.200GHz, TH Express-2,
Intel Xeon Phi 31S1P
NUDT
3,1
20
,00
0
33
,86
2.7
0
54
,90
2.4
0
17
,80
8
01
/11
/20
13
National Super
Computer Center
in Guangzhou
China
Tianhe-2 (MilkyWay-2) -
TH-IVB-FEP Cluster, Intel
Xeon E5-2692 12C
2.200GHz, TH Express-2,
Intel Xeon Phi 31S1P
NUDT
3,1
20
,00
0
33
,86
2.7
0
54
,90
2.4
0
17
,80
8
01
/06
/20
13
National
University of
Defense
Technology
China
Tianhe-2 (MilkyWay-2) -
TH-IVB-FEP Cluster, Intel
Xeon E5-2692 12C
2.200GHz, TH Express-2,
Intel Xeon Phi 31S1P
NUDT
3,1
20,0
00
33
,862.7
0
54
,902.4
0
17
,808
79
01/1
1/2
01
2
DOE/SC/Oak
Ridge National
Laboratory
United States
Titan - Cray XK7 , Opteron
6274 16C 2.200GHz, Cray
Gemini interconnect,
NVIDIA K20x
Cray Inc.
560,6
40
17,5
90.0
0
27,1
12.5
0
8,2
09
01/0
6/2
01
2
DOE/NNSA/LLN
L
United States
Sequoia - BlueGene/Q,
Power BQC 16C 1.60 GHz,
Custom
IBM
1,5
72,8
64
16,3
24.8
0
20,1
32.7
0
7,8
90
01
/11
/20
11
RIKEN Advanced
Institute for
Computational
Science (AICS)
Japan
K computer, SPARC64
VIIIfx 2.0GHz, Tofu
interconnect
Fujitsu
70
5,0
24
10
,51
0.0
0
11
,28
0.4
0
12
,65
9.9
0
01
/06
/20
11
RIKEN Advanced
Institute for
Computational
Science (AICS)
Japan
K computer, SPARC64
VIIIfx 2.0GHz, Tofu
interconnect
Fujitsu
54
8,3
52
8,1
62
.00
8,7
73
.60
9,8
98
.60
01/1
1/2
01
0
National
Supercomputing
Center in Tianjin
China
Tianhe-1A - NUDT TH
MPP, X5670 2.93Ghz 6C,
NVIDIA GPU, FT-1000 8C
NUDT
186
,36
8
2,5
66.0
0
4,7
01.0
0
4,0
40
80
01/0
6/2
01
0
DOE/SC/Oak
Ridge National
Laboratory
United States
Jaguar - Cray XT5-HE
Opteron 6-core 2.6 GHz
Cray Inc.
224,1
62
1,7
59.0
0
2,3
31.0
0
6,9
50
01/1
1/2
00
9
DOE/SC/Oak
Ridge National
Laboratory
United States
Jaguar - Cray XT5-HE
Opteron 6-core 2.6 GHz
Cray Inc.
224,1
62
1,7
59.0
0
2,3
31.0
0
6,9
50
01
/06
/20
09
DOE/NNSA
/LANL
United States
Roadrunner - BladeCenter
QS22/LS21 Cluster,
PowerXCell 8i 3.2 Ghz /
Opteron DC 1.8 GHz,
Voltaire Infiniband
IBM
12
9,6
00
1,1
05
.00
1,4
56
.70
2,4
83
01
/11
/20
08
DOE/NNSA
/LANL
United States
Roadrunner - BladeCenter
QS22/LS21 Cluster,
PowerXCell 8i 3.2 Ghz /
Opteron DC 1.8 GHz,
Voltaire Infiniband
IBM
12
9,6
00
1,1
05
.00
1,4
56
.70
2,4
83
01/0
6/2
00
8
DOE/NNSA/LAN
L
United States
Roadrunner - BladeCenter
QS22/LS21 Cluster,
PowerXCell 8i 3.2 Ghz /
Opteron DC 1.8 GHz,
Voltaire Infiniband
IBM
12
2,4
00
1,0
26.0
0
1,3
75.8
0
2,3
45
81
01/1
1/2
00
7
DOE/NNSA
/LLNL
United States
BlueGene/L - eServer Blue
Gene Solution
IBM
212,9
92
478.2
596.4
2,3
29
01/0
6/2
00
7
DOE/NNSA
/LLNL
United States
BlueGene/L - eServer Blue
Gene Solution IBM
131,0
72
280.6
367
1,4
33
01
/11
/20
06
DOE/NNSA/LLN
L
United States
BlueGene/L - eServer Blue
Gene Solution IBM
13
1,0
72
28
0.6
36
7
1,4
33
01
/06
/20
06
DOE/NNSA
/LLNL
United States
BlueGene/L - eServer Blue
Gene Solution IBM
13
1,0
72
28
0.6
36
7
1,4
33
01
/11
/20
05
DOE/NNSA
/LLNL
United States
BlueGene/L - eServer Blue
Gene Solution
IBM
13
1,0
72
28
0.6
36
7
1,4
33
82
01/0
6/2
00
5
DOE/NNSA/LLN
L
United States
BlueGene/L - eServer Blue
Gene Solution
IBM
65,5
36
136.8
183.5
716
01/1
1/2
00
4
IBM/DOE
United States
BlueGene/L beta-System -
BlueGene/L DD2 beta-
System (0.7 GHz PowerPC
440)
IBM
32,7
68
70.7
91.8
01
/06
/20
04
Japan Agency for
Marine -Earth
Science and
Technology
Japan
Earth-Simulator
NEC
5,1
20
35
.9
41
3,2
00
01
/11
/20
03
Japan Agency for
Marine -Earth
Science and
Technology
Japan
Earth-Simulator
NEC
5,1
20
35
.9
41
3,2
00
01
/06
/20
03
Japan Agency for
Marine -Earth
Science and
Technology
Japan
Earth-Simulator
NEC
5,1
20
35
.9
41
3,2
00
83
01/1
1/2
00
2
Japan Agency for
Marine -Earth
Science and
Technology
Japan
Earth-Simulator
NEC 5,1
20
35.9
41
3,2
00
01/0
6/2
00
2
Japan Agency for
Marine -Earth
Science and
Technology
Japan
Earth-Simulator
NEC
5,1
20
35.9
41
3,2
00
01
/11
/20
01
Lawrence
Livermore
National
Laboratory
United States
ASCI White, SP Power3 375
MHz
IBM
8,1
92
7.2
12
.3
01
/06
/20
01
Lawrence
Livermore
National
Laboratory
United States
ASCI White, SP Power3 375
MHz
IBM
8,1
92
7.2
12
.3
84
01/1
1/2
00
0
Lawrence
Livermore
National
Laboratory
United States
ASCI White, SP Power3 375
MHz
IBM
8,1
92
4.9
12.3
01/0
6/2
00
0
Sandia National
Laboratories
United States
ASCI Red
Intel
9,6
32
2.4
3.2
01
/11
/19
99
Sandia National
Laboratories
United States
ASCI Red
Intel
9,6
32
2.4
3.2
01
/06
/19
99
Sandia National
Laboratories
United States
ASCI Red
Intel
9,4
72
2.1
3.2
01/1
1/1
99
8
Sandia National
Laboratories
United States
ASCI Red
Intel
9,1
52
1.3
1.8
01/0
6/1
99
8
Sandia National
Laboratories
United States
ASCI Red
Intel
9,1
52
1.3
1.8
85
01/1
1/1
99
7
Sandia National
Laboratories
United States
ASCI Red
Intel
9,1
52
1.3
1.8
01/0
6/1
99
7
Sandia National
Laboratories
United States
ASCI Red
Intel
7,2
64
1.1
1.5
01
/11
/19
96
Center for
Computational
Sciences,
University of
Tsukuba
Japan
CP-PACS/2048
Hitachi/Tsukuba
2,0
48
0.4
0.6
01
/06
/19
96
University of
Tokyo
Japan
SR2201/1024
Hitachi
1,0
24
0.2
0.3
01/1
1/1
99
5
National
Aerospace
Laboratory of
Japan
Japan
Numerical Wind Tunnel
Fujitsu
140
0.2
0.2
86
01/0
6/1
99
5
National
Aerospace
Laboratory of
Japan
Japan
Numerical Wind Tunnel
Fujitsu
140
0.2
0.2
01
/11
/19
94
National
Aerospace
Laboratory of
Japan
Japan
Numerical Wind Tunnel
Fujitsu
140
0.2
0.2
01
/06
/19
94
Sandia National
Laboratories
United States
XP/S140
Intel
3,6
80
0.1
0.2
01
/11
/19
93
National
Aerospace
Laboratory of
Japan
Japan
Numerical Wind Tunnel
Fujitsu
14
0
0.1
0.2