Mất điện trong TTDL và nguyên nhân

PDF. In Email

Chủ nhật, 25 Tháng 9 2016 15:31   |  Số truy cập: 543

Hiện tượng mất điện có thể xảy ra ở những TTDL hiện nay dù được thiết kế theo cấp độ nào đi nữa. Bài viết sau trình bày một số nguyên nhân mất điện và yếu tố cốt lõi ảnh hưởng đến khả năng hoạt động liên tục của TTDL.

Chi phí vs rủi ro

Khi thiết kế TTDL, vấn đề chi phí rất quan trọng và thường được cân nhắc với các rủi ro để đưa ra giải pháp phù hợp. Thiết kế hệ thống điện theo cấp độ Tier 1 là giải pháp có chi phí thấp nhất nhưng cũng có rủi ro cao nhất, mỗi thành phần trong hệ thống điện đều là một “đơn điểm gây lỗi” (single point of failure  - SPOF). Dưới đây là mô tả về một hệ thống điện đặc trưng theo tiêu chuẩn Tier 1 cho TTDL.
Nguồn điện ban đầu được dẫn từ lưới điện chuyển đến trạm biến áp hoặc tủ hạ áp bên ngoài TTDL. Nguồn điện này sau đó được cấp cho tủ phân phối điện chính bên trong tòa nhà TTDL để phân phối đến các tủ phụ ở những khu vực khác nhau, mỗi tủ phân phối đều chứa một hoặc nhiều thiết bị ngắt mạch và cầu chì.

Giả sử TTDL có sử dụng máy phát điện, hệ thống điện sẽ cần thêm bộ chuyển nguồn tự động (ATS) trước khi cấp nguồn cho UPS. Tủ phân phối điện ngoài việc cấp nguồn cho UPS còn được dùng để cấp nguồn cho các thiết bị làm mát... Nguồn điện ở phía ngõ ra UPS sau đó sẽ qua các thiết bị ngắt mạch để rẽ nhánh đến các tủ rack. Ở đây, nguồn điện sẽ đi đến các thanh phân phối điện (PDU) gắn rack mà đa số đều được trang bị thiết bị ngắt mạch hoặc cầu chì.

Cuối cùng, điện được dẫn vào dây nguồn (thông thường không có khóa an toàn) để phân phối đến các thiết bị CNTT. Với một thiết kế gồm nhiều “đơn điểm gây lỗi” như vậy, các hạ tầng loại nhỏ khó có thể hoạt động hiệu quả và ổn định trong nhiều năm liền mà không xảy ra sự cố nào.

Cải thiện hệ thống sẵn có

Để giảm thiểu các “đơn điểm gây lỗi” trong thiết kế Tier 1 hiện tại mà không phải chuyển sang hệ thống dự phòng Tier 4 bao gồm hai bộ độc lập về mọi thiết bị trong toàn bộ chuỗi cung cấp điện, ta có thể sử dụng cấp độ tiếp theo trong thiết kế hệ thống điện là Tier 2. Một thiết kế Tier 2 điển hình sẽ có hai hoặc nhiều UPS được nối song song với nhau để cùng chia tải, đảm bảo hỗ trợ tải hoạt động liên tục ngay cả khi có một UPS gặp sự cố. Ngoài ra, khi bảo trì hoặc thay thế mới UPS, khả năng hoạt động của thiết bị vẫn không bị ảnh hưởng.

Ở cấp độ Tier 3, TTDL được thiết kế không chỉ dự phòng về UPS mà còn dự phòng nguồn điện lưới. Sử dụng thêm một đường điện lưới dự phòng để TTDL có hai nguồn điện độc lập đi vào hệ thống ATS trước khi cấp cho UPS sẽ cải thiện đáng kể mức độ dự phòng điện với mức chi phí thấp và dễ dàng thực hiện hơn Tier 4.

Cuối cùng là thiết kế dự phòng Tier 4 với cấu hình giống như hai hệ thống Tier 1, mỗi hệ thống đều có khả năng hoạt động độc lập để duy trì toàn bộ tải. Điện sẽ được cấp từ hai nguồn vào khác nhau và đi qua hai bộ UPS được cấu hình đồng bộ để cùng phân phối đến các thiết bị trên tủ rack.

Với thiết kế Tier 3 và 4, một số điểm giao nhau giữa hai hệ thống cho phép mỗi bên có thể cấp điện sang bên còn lại để bảo trì mà vẫn giữ cho tải tiếp tục hoạt động. Về lý thuyết, thiết kế này sẽ đảm bảo khi bất kỳ thành phần nào của một trong hai hệ thống gặp sự cố, bên còn lại sẽ tiếp tục hỗ trợ tải cho cả hai. Tuy vậy, những giao điểm này có thể ẩn chứa nguy cơ tiềm tàng về xung đột điện diễn ra giữa hai hệ thống.
Nếu gặp vấn đề trong quá trình chuyển mạch do lỗi từ người hoặc hư hỏng thiết bị, toàn bộ hạ tầng sẽ bị mất điện. Ngoài ra, việc bổ sung nhiều thiết bị chuyển mạch cũng khiến đường điện phức tạp hơn và làm giảm độ tin cậy tổng thể cho hệ thống.

Vị trí hư hỏng thường gặp

1. Tủ rack
Ở cấp độ vi mô, sự cố mất điện phổ biến nhất thường xảy ra tại các tủ rack, do tình trạng quá tải của các thiết bị ngắt mạch. Trừ khi bạn có bộ phân phối nguồn thông minh để giám sát dòng điện hiện hành trên tủ hoặc đo thủ công tại bảng điều khiển, còn lại, bạn không thể theo dõi được dòng điện tủ rack đã gần đạt đến giới hạn của thiết bị ngắt mạch hay chưa.

Khi có một thiết bị CNTT mới được sử dụng, có thể nó sẽ không lập tức làm quá tải công tắc của mạch điện nhưng vẫn có khả năng làm cho mạch điện của bạn gần đạt đến mức công suất giới hạn. Nếu tăng thêm một thiết bị bất kỳ, năng lượng tiêu thụ sẽ gây quá tải và ngắt mạch dẫn đến mất điện toàn bộ tủ rack.

Như đã đề cập, ngay cả với thiết kế dự phòng theo tiêu chuẩn Tier 4, độ tin cậy vẫn sẽ không được đảm bảo nếu không tính toán đầy đủ các tác động. Để đảm bảo dự phòng trên tủ rack, điều quan trọng nhất là mức tải tổng cộng của tủ không vượt quá 80% định mức của thiết bị phân phối nguồn.
Ví dụ, một thanh nguồn có khả năng chịu tải 20 A chỉ nên sử dụng tối đa 16 A. Điều này đồng nghĩa nếu sử dụng thiết bị nguồn điện kép, mức tải sẽ không được quá 40% giá trị định mức thanh nguồn (20 A chỉ nên tải 8 A). Trường hợp có một bên nguồn điện bị ngắt do quá tải hoặc lỗi, tổng tải sử dụng sẽ tăng vọt do chuyển mạch vượt quá định mức của thanh nguồn và gây mất điện dây chuyền bên trong tủ rack.

Bên cạnh đó, sự ra đời của các thiết bị điện mật độ cao 1U và máy chủ phiến mới khiến nguồn điện ba pha được dùng phổ biến cho mỗi tủ rack. Quy luật cung cấp điện sẽ tương tự cho mỗi pha, với một pha quá tải sẽ làm ngắt mạch cả ba pha. Do đó, nếu một pha bất kỳ vượt quá mức 40% dòng điện định mức của mạch nhánh, hệ thống điện có thể mất khả năng dự phòng và kéo theo những sự cố mất điện liên tiếp. Cách duy nhất để tránh sự cố này là giám sát hệ thống theo thời gian thực từng mạch nhánh và cài đặt cảnh báo khi có nguy cơ quá tải.

2. Hệ thống pin
Các sự cố mất điện phổ biến nhất cấp độ vĩ mô TTDL thường bắt nguồn từ hệ thống pin của UPS, đặc biệt trong các hạ tầng nhỏ chỉ có một hệ thống UPS với một chuỗi pin duy nhất. Một số hệ thống UPS dạng mô-đun mới sẽ được trang bị pin dạng mô-đun để giảm thiểu các “đơn điểm gây lỗi”.
Một cải tiến thường được sử dụng để nâng cao độ tin cậy pin trong TTDL là cung cấp cho hệ thống UPS với hai hoặc nhiều chuỗi pin được mắc song song. Tuy nhiên, nếu một trong các chuỗi có vấn đề, các chuỗi còn lại cũng sẽ bị ảnh hưởng theo. Rất khó để xác định khả năng hoạt động thực tế của pin trừ khi bạn có hệ thống giám sát đi kèm hoặc thường xuyên kiểm tra tải theo lịch trình. Nếu không, bạn sẽ không nhận ra vấn đề cho đến lúc có sự cố phát sinh, và hệ thống pin vẫn đang hỗ trợ tải hiện tại có thể trở thành nguyên nhân gây mất điện trong tương lai.

Pin luôn cần được bảo trì, kiểm tra và thay thế thường xuyên hơn mọi thành phần điện khác. Nhưng thực tế, trừ khi có ngân sách phân bổ sẵn, nếu không, việc này thường bị trì hoãn hoặc bỏ qua. Để tiết kiệm, doanh nghiệp có thể chỉ thay một chuỗi pin bị yếu. Việc thay các chuỗi pin theo thời điểm khác nhau có thể chấp nhận được, miễn chúng không trực tiếp nối chung trên nguồn DC của hệ thống UPS.
Một thiết kế lý tưởng sẽ gồm các chuỗi pin độc lập, mỗi chuỗi được kết nối riêng tới một mô-đun UPS. Khi được cấu hình như vậy, một chuỗi pin bị hư hỏng sẽ không ảnh hưởng đến các chuỗi pin khác. Ví dụ: Ta có bốn mô-đun UPS, mỗi mô-đun có chuỗi pin riêng và được thiết kế theo tiêu chuẩn Tier 2. Khi một chuỗi pin bị hư hỏng, ba chuỗi pin tương ứng với ba UPS còn lại vẫn hoạt động bình thường để duy trì tải mà không bị ảnh hưởng do chúng được đấu nối độc lập với nhau.

Về lý thuyết, TTDL được thiết kế tính toán đầy đủ các tác động như trên sẽ không gặp sự cố thời gian chết, trừ khi có lỗi do con người gây ra. Nhược điểm của cấu hình này là hiệu suất hệ thống UPS rất thấp. Ở điều kiện thường, mỗi UPS sẽ hoạt động ở mức tải nhỏ (< 37%). Ở mức tải này, những UPS lâu đời sẽ hoạt động với hiệu suất rất thấp (< 75%) so với mức 85 – 90% của những UPS hiện nay. Tuy vậy, nhiều TTDL vẫn chấp nhận mức hiệu suất thấp này vì thay thế mới hệ thống UPS hiện đại sẽ rất rắc rối và tốn kém. Điều này dẫn đến hao phí một lượng điện năng rất lớn, ảnh hưởng trực tiếp đến lợi nhuận của TTDL và cả các tác động xấu đến môi trường.

Hiệu quả năng lượng và khả năng dự phòng

Trong các môi trường TTDL xanh hiện nay, khả năng dự phòng luôn được đề cập cùng với hiệu quả năng lượng. Tier 1 là hệ thống có hiệu quả năng lượng tốt nhất nhưng không có khả năng dự phòng. Ngược lại, Tier 4 là thiết kế có khả năng dự phòng cao nhất với hao phí điện năng lớn do sử dụng nhiều thiết bị điện. Ngày nay, hầu hết doanh nghiệp vẫn thường chọn yếu tố dự phòng để đảm bảo TTDL không bị mất điện, và chỉ có một số ít xem yếu tố “xanh” là quan trọng hơn.
Về lâu dài, nhu cầu điện sẽ tăng cao. Việc sử dụng nhiều thiết bị CNTT có hiệu quả năng lượng cao được kỳ vọng sẽ làm chậm nhu cầu đang tăng nhanh này, đồng thời vẫn đảm bảo công suất và khả năng mở rộng cho hệ thống. Nếu bỏ qua những giải pháp tăng hiệu quả năng lượng, công suất hệ thống sẽ rất nhanh chạm đến ngưỡng tối đa, buộc nhà đầu tư phải xây dựng hoặc nâng cấp TTDL gây tốn kém nhiều thời gian và chi phí.

Vấn đề công suất thiết kế

Khi thiết kế một TTDL, vấn đề về công suất thiết kế luôn được quan tâm đầu tiên. Dựa trên vòng đời dự kiến và nhu cầu sử dụng của TTDL mà người thiết kế sẽ tính toán công suất là bao nhiêu. Với TTDL doanh nghiệp, các bản thiết kế phải đánh giá được công suất hiện có và kế hoạch phát triển trong tương lai, bao gồm cả số lượng tủ rack và nhu cầu điện dự phòng.
Đối với TTDL cho thuê, công suất thiết kế sẽ được tính toán dựa trên nhu cầu khách hàng. Trong quá khứ, các cơ sở mới thường được xây dựng với kích thước và công suất tối đa. Khi đưa vào hoạt động, doanh nghiệp không sử dụng hết công suất gây lãng phí diện tích và điện năng. Trước sự cạnh tranh ngày càng tăng hiện nay, nhiều TTDL mới được xây dựng theo kiểu mô-đun để giảm chi phí ban đầu. Xây dựng TTDL theo kiểu mô-đun cũng cho phép tận dụng tối đa hiệu suất UPS và hệ thống làm mát, giúp các thiết bị hoạt động hiệu quả hơn và dễ dàng mở rộng mức công suất khi cần.

Nguyên nhân cốt lõi gây mất điện TTDL

Cuối cùng, theo thống kê, không phải lỗi phần cứng mà chính con người là nguyên nhân chủ yếu gây mất điện TTDL. Trong hầu hết trường hợp, mất điện trong TTDL có thể được truy lại từ những hạn chế trong bản thiết kế ban đầu, cách lựa chọn mức độ dự phòng hay việc phân bổ ngân sách không đầy đủ để tiến hành bảo trì định kỳ. Việc dự đoán trước và tính toán chính xác công suất cũng như cấu hình của hệ thống điện sẽ tránh cho TTDL gặp phải những sự cố mất điện đáng tiếc.

Bùi Tiến Lợi
Theo Searchdatacenter

 

DMCA.com Protection Status


Các bài viết khác

ABB
ACTi
Brother
CommScope
Emerson
Fluke Network
Fredton
Vietrack