HBM2 khác gì so với HBM?
Nhắc lại về HBM (High-Bandwidth Memory) là giao tiếp RAM hiệu năng cao dành cho các loại bộ nhớ DRAM xếp lớp 3D (3D-stacked) và hiện đã được AMD sử dụng trên các phiên bản GPU dòng Fiji như Fury, Fury X. HBM có băng thông cao hơn mặc dù sử dụng ít điện năng hơn và có kích thước nhỏ hơn so với DDR4 hay GDDR5. Điều này đạt được nhờ việc xếp lớp các đế chip DRAM (die) chồng lên nhau, các đế giao tiếp với nhau nhờ kết nối điện tử dọc với tín hiệu truyền dẫn hoàn toàn thông qua wafer hay đế bán dẫn gọi tắt là TSV (Through-silicon via) và microBump.
Ở thế hệ HBM đầu tiên được sản xuất trên quy trình 29 nm, một stack gồm 4 đế chip DRAM (gọi là 4-Hi) được đặt trên một đế logic, mối đế có 2 kênh 128-bit, tổng cộng 8 kênh cho độ rộng bus nhớ 1024-bit. Mỗi kênh hỗ trợ dung lượng 1 Gb, có 8 bank và hoạt động ở tốc độ truyền 1 Gb/s - 1,25 Gb/s (xung nhịp hiệu quả 1 GHz - 1,25 GHz). Kết quả là mỗi stack 4-Hi HBM cho dung lượng 1 GB và băng thông bộ nhớ từ 128 GB/s đến 160 GB/s.
Quy đổi sang sản phẩm thực tế, một con GPU có 4 stack 4-Hi như AMD Fury X có 4 GB bộ nhớ RAM HBM, độ rộng bus nhớ 4 x 1024 = 4096-bit, băng thông bộ nhớ 128 x 4 = 512 GB/s. Thử so sánh với 1 GPU dùng RAM GDDR5 mạnh nhất của Nvidia hiện nay là Titan X: bộ nhớ lên đến 12 GB nhưng độ rộng bus nhớ chỉ 384-bit và băng thông bộ nhớ chỉ 336 GB/s.
HBM2 cũng được phát triển dựa trên công nghệ cốt lõi của HBM nhưng sẽ mở rộng khả năng của loại bộ nhớ băng thông cao này. Mật độ bộ nhớ được cải thiện, nếu như với HBM thế hệ đầu mỗi đế DRAM có mật độ bộ nhớ là 2 Gb thì HBM2 có mật độ đến 8 Gb > 32 Gb/stack > 1 stack 4-Hi sẽ có dung lượng 4 GB, gấp 4 lần HBM đời đầu. Trên mỗi đế chip DRAM vẫn có 2 kênh 128-bit nhưng được chia thành 16 bank, tốc độ truyền 2 Gb/s (xung nhịp hiệu quả 2 GHz). Nhờ vậy, băng thông bộ nhớ của mỗi stack 4-Hi HBM2 cũng sẽ tăng gấp đôi lên 256 GB/s. Ngoài ra, kiến trúc HBM2 cũng cho phép các nhà sản xuất tạo tùy biến thiết lập bộ nhớ chẳng hạn như 2-Hi (2 đế chip DRAM/stack) hoặc 8-Hi (8 đế chip DRAM/stack).
Nvidia cũng nhấn mạnh về việc bộ nhớ trên GPU sẽ lên đến 16 GB, như vậy có thể hãng sẽ dùng kiểu thiết lập bộ nhớ 4 stack 4-Hi trên dòng GPU thế hệ tiếp theo. Cách thiết lập này tương tự trên AMD Fury X nhưng việc mỗi đế chip DRAM có mật độ bộ nhớ cao hơn (8 Gb/đế chip DRAM) thì tổng dung lượng bộ nhớ trên GPU cao cấp nhất dùng kiến trúc Pascal của Nvidia sẽ gấp 4 lần so với Fury X. Sẽ rất tuyệt vời nếu Nvidia bán ra một chiếc card đồ họa cho người dùng cuối với dung lượng RAM cao như vậy.
Với băng thông bộ nhớ trên lý thuyết của mỗi stack 4-Hi HBM2 là 256 GB/s thì thiết lập 4 x 4 sẽ mang lại tổng băng thông 1 TB/s (1024 GB/s) - đây cũng là mục tiêu mà Nvidia đang nhắm đến. Với rất nhiều thứ được gấp đôi, cả AMD và Nvidia đều cho rằng HBM2 và công nghệ xử lý 14/16 nm sẽ mang lại hiệu năng/điện năng tiêu thụ gấp đôi so với thế hệ GPU trước.
Như vậy vào năm tới, cả đội xanh (Nvidia) và đội đỏ (AMD) đều nhất loạt chuyển sang HBM2, mục tiêu của cả 2 đều hướng đến băng thông bộ nhớ cao hơn và dung lượng lớn hơn. Mặc dù vậy, theo dự đoán thì băng thông bộ nhớ 1 TB/s sẽ không thể là một tính năng phổ biến trên GPU khi mà cả AMD lẫn Nvidia đều vẫn gắn bó với GDDR5 trên các dòng sản phẩm tầm trung. Lợi ích mà HBM/HBM2 mang lại chủ yếu là về dung lượng RAM được tích hợp trên card đồ họa. Với tình hình này thì rất có khả năng Nvidia lẫn AMD sẽ giới thiệu những dòng card đồ họa siêu cao cấp và cao cấp sử dụng HBM2 trong khi dòng card tầm trung với bộ nhớ từ 2 đến 4 GB RAM vẫn dùng GDDR5. Cả 2 hãng vẫn chưa công bố ngày phát hành cụ thể nhưng khả năng những phần cứng mới sẽ xuất hiện vào cuối quý 1 đầu quý 2 năm 2016.
Theo: ExtremeTech
0 Nhận Xét:
Đăng nhận xét