Máy tính cá nhân hiện đại ngày nay đáng tin cậy hơn bao giờ hết, nhưng điều đó không có nghĩa là chúng hoàn hảo. Sự cố thiết bị vẫn xảy ra, dù hiếm hoi, và ngay cả những linh kiện máy tính mạnh mẽ nhất cũng không đáng giá nếu chúng không đáng tin cậy. May mắn thay, thế giới khắc nghiệt của kiểm tra độ bền (stress testing) có thể giúp xác định các lỗi nghiêm trọng *trước* khi PC của bạn bị hỏng giữa chừng một thao tác quan trọng.
Bất cứ khi nào bạn mua hoặc tự lắp ráp PC, thay thế một linh kiện chính, hoặc ép xung một phần cứng, tốt nhất nên kiểm tra độ bền (hay “burn in”) thiết bị mới, điều này *không* giống như đánh giá hiệu năng (benchmarking) hệ thống của bạn.
Tại sao cần kiểm tra độ bền? Đơn giản: Để đảm bảo độ tin cậy và ổn định của hệ thống. Ngay cả khi máy tính khởi động và hoạt động tốt trong điều kiện sử dụng bình thường, phần cứng dễ hỏng có thể gây ra vấn đề khi bạn thực hiện các tác vụ nặng hơn, chẳng hạn như chơi game hoặc chỉnh sửa video. Phần mềm kiểm tra độ bền đặt các linh kiện của bạn vào tải trọng công việc cao để mô phỏng trường hợp xấu nhất; nếu một linh kiện bị treo, lỗi hoặc không vượt qua bài kiểm tra độ bền chuyên dụng, thì có khả năng nó sẽ không đáng tin cậy khi chịu tải nặng hàng ngày. Tốt nhất là phát hiện các linh kiện không ổn định sớm hơn là muộn, trong khi chúng vẫn còn được bảo hành.
Việc chạy các bài kiểm tra độ bền cũng có thể cho bạn biết liệu bạn có cần thêm hệ thống làm mát cho máy tính hay không. Nếu card đồ họa hoặc CPU ép xung liên tục bị quá nhiệt và tắt nguồn trong quá trình kiểm tra độ bền, đã đến lúc thay thế bộ tản nhiệt cũ, thêm một vài quạt case, và thậm chí có thể xem xét làm mát bằng chất lỏng.
Tất cả những điều đó được nói ra, quá trình kiểm tra độ bền thực tế không quá phức tạp, mặc dù nó có thể tốn thời gian. Thưa quý vị, đã đến lúc khởi động động cơ của chúng ta.
Chuẩn bị
Thực tế thì không phải vậy. Trước khi bắt đầu tra tấn PC của bạn, bạn cần có cách để theo dõi tiếng kêu của nó. Phần mềm HWMonitor của CPUID làm chính xác điều đó, cung cấp cho bạn cái nhìn thực tế về nhiệt độ, điện áp và tốc độ quạt của các linh kiện. SpeedFan cũng làm điều tương tự, mặc dù giao diện của nó không được trau chuốt như HWMonitor.
Bạn nên mở ít nhất một trong hai chương trình này trong quá trình kiểm tra độ bền. Mặc dù nhiều linh kiện sẽ tự động tắt nếu quá nhiệt, nhưng không phải tất cả đều như vậy, và bạn cần rút phích cắm kiểm tra nếu phần cứng của bạn đạt đến mức nhiệt nguy hiểm. Bạn *có thể* làm hỏng các linh kiện của mình nếu trường hợp xấu nhất xảy ra và bạn không chú ý. Nếu bạn thấy nhiệt độ CPU bắt đầu tăng lên trên 70 độ C, hoặc nhiệt độ card đồ họa khoảng 105°C (mặc dù điều này thay đổi tùy theo model – hãy tìm hiểu!), hãy dừng kiểm tra và thêm hệ thống làm mát cho máy tính của bạn. Bạn cũng nên tạm dừng kiểm tra nếu nhiệt độ liên tục ở mức đó trong thời gian dài.
Trước khi bắt đầu kiểm tra, tôi khuyên bạn nên đóng tất cả các chương trình không cần thiết và vào cài đặt nguồn của hệ thống để ngăn hệ thống chuyển sang chế độ ngủ. Bạn không muốn máy tính của mình ngủ gật trong khi bạn đang bận “burn in” nó. Nếu bạn sử dụng trình bảo vệ màn hình, hãy tắt nó đi.
Ép xung CPU với Prime95
Nếu bạn chỉ kiểm tra độ bền một linh kiện duy nhất, hãy kiểm tra CPU. Nó quan trọng như vậy – và thường là thủ phạm gây ra sự không ổn định của hệ thống.
Mặc dù có một số chương trình có thể kiểm tra CPU đến giới hạn của nó, nhưng Prime95 đã trở thành tiêu chuẩn *thực tế*. Được thiết kế ban đầu để tìm các số nguyên tố Mersenne, phần mềm này hoàn toàn làm cho bộ xử lý của bạn hoạt động hết công suất, đến mức các nhà phát triển hiện nay đã đưa vào chế độ “Kiểm tra tra tấn” dành riêng cho những người quan tâm đến độ ổn định của hệ thống hơn là toán học phức tạp.
Mở chương trình, sau đó vào *Tùy chọn > Kiểm tra tra tấn* để hiển thị danh sách các tùy chọn. Nhiều người sử dụng bài kiểm tra **Blend**. Blend kiểm tra cả CPU và RAM; nếu không có lỗi nào xuất hiện sau khoảng bốn giờ, bạn có thể coi nó ổn định để sử dụng bình thường. Ngoài ra, các bài kiểm tra tra tấn **Small FFT** và **Large FFT** sẽ giảm tải RAM một chút để tác động đến CPU càng nhiều áp lực và nhiệt càng tốt.
Nếu bạn có thời gian (và hệ thống làm mát đầy đủ), bạn có thể thoải mái “tra tấn” PC của mình bằng Prime95 trong thời gian rất, rất dài, đặc biệt nếu bạn dự định sử dụng máy tính của mình cho các dự án kiểu folding@home, có thể tiêu tốn rất nhiều tài nguyên CPU trong thời gian dài. Prime95 đôi khi phát hiện lỗi CPU ngay cả sau nửa ngày kiểm tra. Nếu hệ thống của bạn có thể chạy bài kiểm tra Small FFT của Prime95 trong 24 giờ liền mà không gặp sự cố, thì CPU chắc chắn như đá và sẵn sàng hoạt động.
Bạn muốn có ý kiến thứ hai? Các chương trình khác nhau kiểm tra CPU theo những cách khác nhau. Những người khó tính cũng đánh giá cao IntelBurnTest và OCCT – hai chương trình kiểm tra CPU khác. Tuy nhiên, cả hai đều tác động mạnh đến bộ xử lý của bạn và làm tăng nhiệt độ rất nhanh, vì vậy hãy theo dõi chặt chẽ phần mềm giám sát hệ thống khi bạn bắt đầu chúng.
Bất kể bạn chọn chương trình kiểm tra nào, hãy chạy nó trong ít nhất bốn giờ; chạy qua đêm là tốt hơn. Cá nhân tôi thích kiểm tra độ bền các PC mới bằng các bài kiểm tra Blend và Small FFT của Prime95 trong ít nhất mười hai giờ mỗi bài, và đôi khi tôi tiếp tục với bài chạy IntelBurnTest ở mức độ căng thẳng **Cao** hoặc **Rất cao** kéo dài một giờ. Quá mức? Có thể. Nhưng nếu CPU của bạn sống sót sau tất cả những điều đó, thì chắc chắn đó là một người giữ cửa đáng tin cậy.
Kiểm tra RAM
Khi nói đến việc kiểm tra RAM nghiêm túc, chỉ có một lựa chọn đáng xem xét: MemTest86+. Phần mềm chẩn đoán đã được thử nghiệm và tin cậy này đã tồn tại từ lâu, và mặc dù nó chắc chắn trông có vẻ cũ kỹ – MemTest86+ có giao diện kiểu BIOS xấu xí – nhưng chương trình vẫn hiệu quả như trước đây.
Đơn giản chỉ cần ghi MemTest86+ vào ổ flash hoặc CD, chèn nó vào PC của bạn, sau đó khởi động máy tính của bạn bằng phương tiện bạn đang sử dụng. Sau khi nó hoạt động, hãy để phần mềm hoạt động trong một thời gian dài – tốt nhất là qua đêm một lần nữa. Mục tiêu là có *KHÔNG* có lỗi. Nếu bạn gặp lỗi, bạn sẽ phải kiểm tra lại từng mô-đun RAM riêng lẻ để xác định mô-đun nào là thủ phạm.
Xác minh độ ổn định của card đồ họa
Nếu bạn là game thủ, việc kiểm tra độ bền card đồ họa là điều hiển nhiên, đặc biệt là vì card đồ họa có xu hướng bị lỗi khi chịu tải nặng hơn – bạn biết đấy, giống như các tải do các game cao cấp tạo ra. Một lợi ích khác: Các bài kiểm tra tra tấn đồ họa thường khiến các nguồn cung cấp điện yếu hoặc bị lỗi từ bỏ, vì vậy bạn đang kiểm tra hai con chim một lúc. Hiệu quả tuyệt vời!
Có rất nhiều công cụ đánh giá hiệu năng, nhưng FurMark được thiết kế đặc biệt để khiến GPU của bạn phải hoạt động vất vả và trừng phạt card đồ họa *nhiều* hơn so với trò chơi trung bình. Chương trình này sử dụng hình ảnh render thời gian thực của các vật thể có lông tơ uốn lượn trước nền tảng tuyệt vời để đẩy card đồ họa của bạn đến giới hạn của nó, hoàn chỉnh với các tùy chọn chống răng cưa và độ phân giải. Hãy sử dụng bài kiểm tra burn-in tiêu chuẩn, nhưng hãy để mắt đến HWMonitor và / hoặc SpeedFan – FurMark làm cho GPU của bạn nóng lên rất nhanh. Bạn sẽ không cần chạy FurMark trong thời gian dài. Nếu card đồ họa của bạn sắp bị treo hoặc bắt đầu tạo ra các hiện vật hình ảnh kỳ lạ, nó sẽ làm như vậy trong vòng 15 đến 30 phút.
Ngoài ra, Uningine – nhà sản xuất chuẩn mực đồ họa Heaven nổi tiếng – gần đây đã phát hành “Valley”, một công cụ kiểm tra độ bền GPU mới đẹp hơn và yên bình hơn Furmark. Tuy nhiên, tôi chưa có cơ hội sử dụng nó rộng rãi.
Sau khi GPU của bạn vượt qua bài kiểm tra độ bền chính, tôi thích chạy một số chuẩn mực có nguồn gốc từ các trò chơi thực tế để xem card đồ họa hoạt động như thế nào trong điều kiện sử dụng thực tế. Phần mềm yêu thích của tôi để làm điều đó là các công cụ đánh giá hiệu năng Alien vs. Predator và S.T.A.L.K.E.R, cả hai đều có sẵn miễn phí.
Còn lại thì sao?
CPU, GPU và RAM là những linh kiện hệ thống chính duy nhất bạn thực sự cần phải lo lắng về việc kiểm tra độ bền. Bạn có nên đánh giá hiệu năng ổ cứng của mình để đảm bảo chúng đang cung cấp tốc độ truyền dữ liệu như đã hứa hay không? Chắc chắn rồi – nhưng đó là vấn đề về hiệu năng, chứ không phải là vấn đề về độ ổn định hay độ tin cậy. Tôi khuyên bạn nên kiểm tra tình trạng sức khỏe của ổ cứng mới bằng công cụ giám sát S.M.A.R.T., nhưng chỉ vậy thôi, ngoài nguyên tắc thông thường “Hãy đảm bảo dữ liệu của bạn được sao lưu!”.
Tương tự như vậy, bạn có thể phát một video dài với độ sáng màn hình cao nếu bạn lo lắng về thời lượng pin của máy tính xách tay, nhưng một lần nữa, điều đó không cần thiết và giống như một bài kiểm tra hiệu năng hơn là bài kiểm tra độ bền.
Mặc dù hướng dẫn này có thể giúp đảm bảo độ ổn định của hệ thống, nhưng các phương pháp và công cụ được nêu ra ở đây không phải là lựa chọn duy nhất của bạn. Trên thực tế, có rất nhiều chiến lược và giải pháp phần mềm kiểm tra độ bền khác nhau ngoài kia. Bạn *kiểm tra độ bền PC của mình như thế nào*?