Tæng C«ng ty ViÔn th«ng Qu©n ®éi Phßng kü thuËt ---------------------
H− íng íng DÉn xö lý sù cè thiÕt bÞ tr¹m BTS 3012
Phiªn b¶n 1 2008
Đào Đại Nghĩ a - Phòng K ỹ thuật TCT – Đ Đà N ẵ ẵng g 05/2008 n
1
Tæng C«ng ty ViÔn th«ng Qu©n ®éi Phßng kü thuËt ---------------------
H− íng DÉn xö lý sù cè thiÕt bÞ tr¹m BTS 3012
NGƯỜ I LẬP
NGƯỜ I PHÊ DUYỆT
Đào Đại Nghĩ a - Phòng K ỹ thuật TCT – Đà N ẵn g 05/2008
2
Phần E: Hướ ng dẫn xử lý sự cố I.
II.
III.
Giớ i thiệu chung.................................................................................... 4 1. Cách xác định lỗi.................................................................................. 4 2. Phươ ng pháp xử lý lỗi........................................................................... 4 Các lỗi thườ ng gặ p................................................................................ 5 1. Lỗi trên hệ thống anten – feeder ............................................................. 5 2. Lỗi truyền dẫn...................................................................................... 8 3. Lỗi k ết nối phần cứng.......................................................................... 10 4. Lỗi phần cứng..................................................................................... 11 Các biện pháp phòng ngừa lỗi.............................................................. 11
Đào Đại Nghĩ a - Phòng K ỹ thuật TCT – Đà N ẵn g 05/2008
3
I.
Giớ i thiệu chung 1. Các cách xác định lỗi o
Nhận đượ c lỗi từ các cảnh báo (Alarm) bao gồm: Cảnh báo từ hệ thống điều khiển (Alarm console) Cảnh báo từ hộ p cảnh báo (Alarm box) Cảnh báo từ trung tâm vận hành (OMC)
o
Nhận đượ c lỗi từ việc thống kê phân tích lưu lượ ng Nhận đượ c lỗi từ Driving test
o
Nhận đượ c lỗi từ việc kiểm tra định k ỳ
o
Nhận đượ c lỗi từ các phàn nàn của khách hàng. a. Xác định thiết bị lỗi o
o
Nếu BSC có lỗi thì thườ ng là nó sẽ ảnh hưở ng hưở ng đến tất cả các tr ạm BTS Nếu BTS có lỗi thì nó sẽ chỉ ảnh hưở ng
đến một số tr ạm hoặc nó sẽ ảnh
đến chính nó và tỷ lệ chuyển vùng thành công (handover success rate) của các cell lân cận o Trong khi mở r ộng phát triển mạng, chúng ta có thể tráo đổi các BTS và vì thể gây ra lỗi cho BSC hoặc BTS o Lỗi gây ra bở i quá trình bảo dưỡ ng sai. b. Các loại lỗi trong BTS o Lỗi Antenna & Feeder o Lỗi truyền dẫn Lỗi k ết nối phần cứng o o Lỗi phần cứng 2. Phươ ng pháp xử lý lỗi a. Phân tích thông tin cảnh báo Thông tin cảnh báo từ hệ thống cảnh báo BSS thườ ng chỉ thị thông qua âm thanh, ánh sáng, đèn LED và các biểu tượ ng đưa ra trên màn hình… Nó bao gồm các mô tả chi tiết về tr ạng thái không bình thườ ng, các nguyên nhân có thể, các gợ i ý khắc phục, bao gồm phần c ứng, k ết n ối (link), trung k ế và tỷ lệ tải CPU vv... Chúng là các điểm mấu chốt để phân tích và xác định lỗi. b. Phân tích các tr ạng thái chỉ báo o Các chỉ báo có thể chỉ ra các tr ạng thái làm việc của mạch, của link, đườ ng truyền quang, node và của chế độ active/standby c. K ết quả phân tích thống kê lưu lượ ng o Đây là phươ ng pháp chủ yếu để xác định lỗi của phần mềm RNO. d. Phân tích k ết quả đo kiểm bằng công cụ, máy đo o Nó phản ánh lỗi một cách tự nhiên qua các dữ liệu đã đượ c lượ ng tử hóa và có thể nhận ra đượ c Đào Đại Nghĩ a - Phòng K ỹ thuật TCT – Đà N ẵn g 05/2008 4 o
o
Một số loại công cụ, máy đo Máy phân tích báo hiệu (Signaling Analyzer), điện thoại test (Test phone) như máy
TERM, máy Bird (Site Analyzer) vv… e. Dò theo các giao diện (Tracing the Interface) c sử dụng để xác định nguyên nhân gây lỗi k ết nối cuộc gọi của thuê bao và o Nó đượ tươ ng tác báo hiệu nội đài vv... o
K ết quả dò có thể dùng để tìm ra nguyên nhân tr ực tiế p gây lỗi cuộc gọi và xác định vị đượ c vấn đề hoặc thu đượ c dấu hiệu cho các phân tích tiế p theo.
f. Gọi kiểm tra (Calling Test)
Đây là cách đơ n giản nhất và nhanh nhất để đưa ra phán đoán về chức năng xử lý cuộc gọi và các module liên quan của BSS bình thườ ng hay không. g. So sánh và tráo đổi o So sánh: So sánh các thành ph ần lỗi hoặc các hiện tượ ng lỗi vớ i những cái bình thườ ng để tìm ra sự khác biệt qua đó tìm ra vấn đề. Phươ ng pháp này thườ ng đượ c dùng vớ i các vấn đề đơ n giản. o Tráo đổi: Nếu lỗi không thể xác định nguyên nhân ngay cả khi các phần tử dự phòng đã đượ c thay, bạn có thể tráo đổi các phần tử bình thườ ng (như bo mạch, sợ i quang vv…) vớ i các phần tử có khả năng bị lỗi và so sánh tr ạng thái hoạt động để phân biệt ra phần bị lỗi. Phươ ng pháp này thườ ng đượ c dùng vớ i các vấn đề lỗi phức tạ p h. Tắt bật /khở i động lại (Switching/Resetting) Cách này không xác định đượ c nguyên nhân lỗi một cách chính xác, do đượ c chạy o lại phần mềm, lỗi có thể sẽ không xẩy ra nữa, vì thế khó có thể biết đượ c nguyên nhân lỗi thực sự và khắc phục vấn đề. o Đây là phươ ng pháp khẩn cấ p và chỉ dùng trong tr ườ ng hợ p khẩn cấ p o
II. Các lỗi thườ ng gặ p 1. Lỗi trên hệ thống anten – feeder a. BTS feeder system structure
Đào Đại Nghĩ a - Phòng K ỹ thuật TCT – Đà N ẵn g 05/2008
5
Phân loại lỗi: Phân loại
Lỗi
Trên tín hiệu
đườ ng xuống (downlink signal)
Hiện tượ ng
Không có tín hiệu đườ ng
MS lỗi truy nhậ p vào mạng, các cuộc gọi không thiết lậ p
đượ c, cuộc gọi bị r ớt , TRX r ỗi (idle) trong thờ i gian dài
xuống Tín hiệu đườ ng
Chất lượ ng chuyển đổi kém, vùng phủ của BTS bị co hẹ p
xuống yếu
Trên tín hiệu đườ ng lên
Không có tín hiệu đườ ng lên
Các cuộc gọi không thể thiết lậ p
Độ nhậy thu của Chất lượ ng chuyển đổi kém, vùng phủ của BTS bị co hẹ p BTS yếu Có cảnh báo sóng Cảnh báo VSWR tại DDPU Lỗi hệ thống đứng VSWR Feeder-Anten Cảnh báo bộ K Đ Có bộ khuyếch đại tạ p âm thấ p LNA tại DDPU tạ p âm thấ p LNA b. Các lỗi hay gặ p trên đườ ng xuống o Mô tả Không có tín hiệu đườ ng xuống Tín hiệu đườ ng xuống yếu
(uplink signal)
o
Phân tích Không có tín hiệu đườ ng xuống
B1: Xem lại các cảnh báo cũ và các cảnh báo thờ i giam thực ở OMC hoặc ở tr ạm bằng phần mềm “local maintenance console” B2: Nếu có cảnh báo sóng đứng nghiêm tr ọng ở DDPU thì phần lớ n khả năng là do khối DTMU đã t ắt b ộ khuyếch đại công suất làm cho không có tín hiệu đầu ra. Cách xử lý: – Kiểm tra VSWR của tuyến antena-feeder bắt đầu từ điểm jumper đấu vào DDPU. – Nếu VSWR vẫn nằm trong giớ i hạn cho phép thì tiế p tục xác định lỗi bằng phươ ng pháp khoanh vùng như sau: B3: Vì hiện tượ ng là không có tín hiệu đườ ng xuống, vì vậy điểm lỗi phải nằm trong đườ ng tín hiệu RF. Nếu điểm lỗi đượ c xác định nằm trong phần t ừ cổng ra của DDPU tớ i antenna trên đỉnh cột, thì DDPU sẽ phát hiện đượ c và đưa ra cảnh báo VSWR. Nếu không đúng thì có thể k ết luận là điểm lỗi nằm giữa đầu ra của TRX tớ i đầu ra của DDPU. Cách xử lý: – Kiểm tra cáp k ết nối giữa các cổng DTRU TX1, TX2 vớ i DDPU TXA, TXB hoặc DTRU TCOM vớ i DDPU TXA, TXB là đúng.
Đào Đại Nghĩ a - Phòng K ỹ thuật TCT – Đà N ẵn g 05/2008
6
B4: Nếu các cách làm trên v ẫn không tìm đượ c lỗi thì thay DDPU. B5: Nếu các cách làm trên v ẫn không tìm đượ c lỗi thì thay DTRU. Tín hiệu đườ ng xuống yếu: Triệu chứng của lỗi này là vùng phủ của BTS hoặc của các sóng mang bị thu hẹ p. Cách xử lý như sau: B1: Kiểm tra công suất đầu ra của TRX là bình thườ ng. B2: Kiểm tra chỉ số VSWR đo đượ c tại DDPU là bình thườ ng. B3: Kiểm tra suy hao xen của đườ ng truyền qua DDPU. B4: Kiểm tra các đầu nối liên quan đến đườ ng tín hiệu RF đã đượ c bắt chặt. c. Các lỗi thườ ng gặ p trên đườ ng lên Mô tả o Không có tín hiệu đườ ng lên Độ nhậy thu của BTS yếu Phân tích o Không có tín hiệu đườ ng lên B1: Thử thay thế đườ ng feeder-antenna khác cho cái không có tín hiệu đườ ng lên – Nếu tín hiệu đườ ng lên đượ c khôi phục ở đườ ng feeder mớ i thì chắc chắn đườ ng feeder nguyên gốc là có vấn đề. – Nếu hiện tượ ng vẫn lặ p lại thì DDPU có vấn đề. Kiểm tra lại các cáp nối giữa RXA1-4 và RXB1-4 vớ i các đườ ng RXM1, RXD1, RXM2, RXD2 là đúng (theo cấu hình). B2: Nếu lỗi vẫn chưa đượ c khắc phục thì thay DDPU, và lậ p bản ghi liên quan đến tình tr ạng lỗi và đính kèm DDPU bị lỗi; – Chú ý: Khôi phục lại k ết nối antenna feeder về tr ạng thái ban đầu của nó. Khi thay đổi antenna feeder đảm bảo r ằng: – Hai antenna - feeders tươ ng ứng sẽ trong cùng cell/sector – K ết nối antenna lên đượ c khôi phục về tr ạng thái ban đầu sau khi xác định đượ c lỗi. Nếu không vùng phủ của cell có thể sẽ bị ảnh hưở ng. Đây là các nguyên tắc cơ bản phải tuân thủ, khi sử dụng phươ ng pháp này để giải quyết vấn đề. Độ nhậy thu của BTS yếu Kiểm tra VSWR của antenna feeder – Nếu nó quá lớ n thì chứng tỏ k ết nối của một phần tử nào đó trong tuyến antenna feeder RF là kém ch ất lượ ng. – Nếu VSWR là bình thườ ng thì các chỉ số năng lực kênh thu của DDPU như độ lợ i (gain), hệ số tạ p nhiễu (noise factor). Đào Đại Nghĩ a - Phòng K ỹ thuật TCT – Đà N ẵn g 05/2008 7
Độ nhậy thu của BTS yếu Các lỗii thông thườ ng sẽ có thể đượ c xác định bằng cách phát triển các phươ ng pháp ở trên. Nhưng sẽ không thể tránh đượ c một số lỗi không thể xác định đượ c theo các phươ ng pháp này, vì nó không phải là cách kiểm tra toàn diện. Ví dụ: Độ lợ i giảm và hệ số tạ p nhiễu tăng trong tr ườ ng hợ p của bộ khuyếch đại sẽ không đượ c phản ánh trong tr ạng thái hoạt động và lỗi sẽ không thể xác định đượ c. Việc tạo các bản ghi rõ ràng về tr ạng thái lỗi sẽ r ất hữu ích cho các phân tích sâu hơ n sau đó. d. Các lỗi thông thườ ng trên hệ thống feeder Mô tả o Cảnh báo VSWR trên DDPU
o
Phân tích Cảnh báo sóng đứng – Kiểm tra VSWR của hệ thống antenna - feeder. Nếu nó thấ p hơ n 1.5, mà cảnh báo DDPU VSWR vẫn đượ c tạo ra thì cảnh báo này sẽ đượ c xem như là một cảnh báo lỗi và cần phải thay DDPU. – Nếu VSWR là cao hơ n 1.5, thì cần điều chỉnh các k ết nối antenna feeder cho đến khi VSWR thấ p hơ n 1.5 – Tiêu chuẩn lắ p đặt yêu cầu VSWR thấ p hơ n 1.3
2. Lỗi truyền dẫn a. Mô tả o
Bảng điều khiển cảnh báo (Alarm console) “Bo BIE (BTS Interface Unit) mất
đồng bộ PCM”, “có cảnh báo
LAPD_OML” o
Chươ ng trình điều khiển thống kê lưu lượ ng Tỷ lệ chuyển giao thành công, tỷ lệ r ớt cuộc gọi của cell là bất thườ ng.
o
Phàn nàn của khách hàng Không thể gọi, chất lượ ng tồi, r ớt cuộc gọi
b. Các nguyên nhân Thiết bị truyền dẫn, bo mạch hoặc luồng E1 bị lỗi o Nhiều loại thiết bị truyền dẫn thì sẽ có nhiều lỗi o o
Mã đườ ng dây, mã phát hiện, sửa lỗi dùng khác loại nhau (HDB3, CRC4) Chất lượ ng k ết nối luồng E1 tồi Nó sẽ gây ra chất lượ ng kém hoặc luồng truyền dẫn bị chậ p chờ n
o
Tỷ lệ lỗi bit cao High BER (bit error rate) Truyền dẫn Vi ba và HDSL
đặc biệt là khi tr ời mưa
Lỗi hệ thống tiế p đất Đào Đại Nghĩ a - Phòng K ỹ thuật TCT – Đà N ẵn g 05/2008 o
8
c. Lỗi truyền dẫn loại 1: E1 chậ p chờ n Tiến trình xử lý o o
Các nguyên nhân có thể là thiết bị truyền dẫn, bo mạch hoặc luồng lỗi B1: Thực hiện kiểm tra self-loop test phía BTS và kiểm tra đèn chỉ thị LIU của
card TMU là tắt. Nếu đèn LIU không tắt thì vấn
đề nằm trong card TMU
thay card TMU. B2: Thực hiện kiểm tra self-loop test về phía BSC và kiểm tra chỉ thị E1 của bo
BIE của BSC là OFF. Nếu BIE không OFF, thì vấn
đề nằm ở thiết bị truyền
dẫn. B3: Kiểm tra phần mềm quản lý truyền d ẫn NM và kiểm tra các cảnh báo liên
quan. Dựa trên các cảnh báo (nếu có) này bạn có thể xác
định vấn đề nằm ở
thiết bị truyền dẫn. B4: Nếu không có cái nào lỗi thì vấn
đề nằm ở khả năng tươ ng tác giữa thiết bị
truyền dẫn và BSC (hoặc BTS) d. Lỗi truyền dẫn loại 2: Cảnh báo OML thườ ng xuyên o
Tiến trình xử lý Lý do có thể là luồng E1
đượ c đấu tiế p đất công tác không tốt hoặc thiết bị
truyền dẫn lỗi. Kiểm tra card TMU trong BTS để kiểm tra thiết lậ p tiế p đất cho luồng E1. Kiểm tra điện tr ở của đầu nối E1 và rack máy
để đo tình tr ạng cách ly. Kiểm tra đầu nối E1 trong DDF (khi l ắ p đặt) đã đượ c đấu đất Kiểm tra vỏ của thiết bị truyền dẫn E1 đã đượ c đấu đất Kiểm tra toàn bộ hệ thống sử dụng cùng một hệ thống nối đất. Nếu không sửa đổi lại cho đúng, r ồi kiểm tra xem vấn đề đã đượ c khắc phục chưa. Nếu v ấn đề không đượ c kh ắc ph ục sau các bướ c đo kiểm tra ở trên thì vấn đề nằm ở thiết bị truyền dẫn, luồng truyền dẫn E1 hoặc card giao diện E1. Kiểm tra k ết nối và thực hiện kiểm tra loop test khoanh vùng để xác định lỗi. Kiểm tra phần mềm NM và kiểm tra các cảnh báo liên quan. Và xử lý nó theo các hướ ng dẫn của thiết bị truyền dẫn. e. Tr ườ ng hợ p lỗi điển hình: OML chậ p chờ n do E1 tiế p đất sai. Mô tả o OML của tr ạm thườ ng xuyên bị gián đoạn và chỉ thị tươ ng ứng c ủa E1 ở đầu BSC nháy liên tục. Phòng máy đặt trên đỉnh đồi cao 300m. Phòng đặt thiết bị truyền dẫn cách xa 20m. Tại tr ạm, k ỹ sư O&M tìm thấy các vấn đề sau: – Luồng E1 đã đượ c đấu đất và đã đượ c kiểm tra đúng DIP switch – Đầu nối E1 đã đượ c bảo vệ cách li vớ i vỏ tủ máy. Cáp tiế p đất công tác đã đượ c đấu nối vớ i hệ thống đất của phòng máy. Đào Đại Nghĩ a - Phòng K ỹ thuật TCT – Đà N ẵn g 05/2008 9
– DDF và tất cả các khung kim loại đã đượ c nối tớ i cáp tiế p máy. Đầu nối E1 tiế p xúc vớ i khung kim loại của DDF
đất của phòng
– Không có chống sét cho luồng E1 đượ c sử dụng o
– Đèn chỉ thị của luồng E1 nháy nhanh Tiến trình xử lý B1: self-loop luồng E1 tại
đỉnh tủ BTS nhận đượ c đèn chỉ thị cáp luồng E1 là
OFF BTS là OK. B2: self-loop luồng E1 trên DDF và nhận đèn chỉ thị cáp luồng E1 là OFF luồng E1 từ BTS đến DDF là OK B3: self-loop về BSC trên DDF và thấy tr ạng thái E1 là OFF E1 từ BSC đến
DDF là OK B4: Tắt nguồn của TMU r ồi bật lại, vẫn lỗi B5: Tháo luồng E1 ra khỏi DDF, vẫn lỗi B6: Ngắt k ết nối E1
ở đỉnh tủ BTS, tắt nguồn và tháo TMU. Kiểm tra điện tr ở giữa vỏ đầu nối E1 đỉnh tủ và cáp tiế p đất của tủ máy thì thấy chúng đã cách ly vớ i nhau ( bình thườ ng) B7: Thay đổi TMU DIP switch sang v ị trí tươ ng ứng để tiế p đất của cáp luồng E1 thành OFF (không nối đất), vẫn lỗi B8: Tháo đầu k ết nối E1 ra khỏi DDF thay đổi TMU DIP switch sang v ị trí tươ ng ứng để tiế p đất của cáp luồng E1 thành OFF (không nối đất). Hết lỗi B9: Để xác nhận lỗi, thay TMU (vớ i cáp E1 không đượ c nối đất). Để vỏ đầu nối E1 tiế p xúc vớ i DDF thì thấy đèn chỉ thị E1 trên TMU nháy nhanh Lỗi Khôi phục lại TMU ban đầu và tháo đầu nối E1 ra khỏi DDF, lỗi biến mất. 3. Lỗi k ết nối phần cứng Tr ườ ng hợ p lỗi điển hình: cảnh báo VSWR do cáp đứt o Mô tả: Trên phần mềm O&M tr ạm BTS, có một TRX trong một sector có đèn cảnh báo đỏ, alarm console chỉ ra cảnh báo TRX VSWR. Tr ạm vừa đượ c lắ p mớ i. Tại tr ạm k ỹ sư O&M tìm thấy các vấn đề sau: – Cáp RF giữa TRX vớ i DDPU đã đượ c k ết nối tốt – Dây nhẩy RF tớ i DDPU cũng đã đượ c k ết nối đúng – Cáp RF (dây nhẩy) giữa DDPU và thiết bị chống sét đã đượ c k ết nối. o Tiến trình xử lý: B1: Kiểm tra tất cả các k ết nối từ TRX đến đườ ng feeder chính và chống sét để vặn chặt lại tất cả các chỗ nối, nếu vấn đề vẫn còn thì nó không nằm ở k ết nối. B2: Nối DDPU của sector bị lỗi đến feeder-antenna của một sector tốt khác, đèn cảnh báo TRX vẫn đỏ, tức là hệ thống antenna và feeder không có lỗi, phục hồi lại các k ết nối. Đào Đại Nghĩ a - Phòng K ỹ thuật TCT – Đà N ẵn g 05/2008 10
B3: Thay TRX lỗi bằng một cái mớ i, cảnh báo TRX vẫn
đỏ, tức là TRX không
có vấn đề, khôi phục lại như cũ. B4: Thay cáp giữa TRX và DDPU, vấn
đề biến mất Vấn đề là cáp bị đứt
trong khi vận chuyển. 4. Lỗi phần cứng Tr ườ ng hợ p lỗi điển hình: Tr ạm bị lỗi do TRX lỗi o
Mô tả Tr ạm không có lưu lượ ng và khách hàng phàn nàn r ằng họ không thể gọi điện. Nó là một tr ạm omni-directional và chỉ có một TRX Tại tr ạm, k ỹ sư O&M tìm thấy các vấn đề sau:
– Tất cả các card
đều đúng vị trí và tất cả các đèn chỉ thị đều không có cảnh
báo – Hệ thống Antenna và feeder tốt – Hệ thống tiế p đất tốt – Hệ thống nguồn tốt o
Tiến trình xử lý B1: Kiểm tra trên hệ thống điều khiển OMC, tìm thấy cảch báo link radio trong tr ạm. B2: Kiểm tra trên hệ thống điều khiển O&M OMC BTS không có card nào đỏ. B3: Kiểm tra phần mềm của các card, t ất cả đều đúng B4: Thay card TMU bằng một cái mớ i, vẫn lỗi, phục hồi lại như cũ. B5: Reset lại TRX và thay tất cả các k ết nối
đến TRX bằng cái mớ i, vẫn lỗi,
phục hồi lại như cũ. B6: Thay đổi TRX bằng một cái mớ i, vấn đề biến mất lỗi nằm ở TRX
III. Các biện pháp phòng ngừa lỗi Các biện pháp phòng ngừa lỗi cho BTS 1. Phần cứng: Tiêu chuẩn lắ p đặt là quan tr ọng nhất Cần chú ý hơ n cho đầu nối E1 o o o o
Cần chú ý hơ n cho đầu nối feeder Cần chú ý hơ n để chống thấm nướ c cho hệ thống antenna và feeder Kiểm tra xác nhận hệ thống chống sét và tiế p đất đã đượ c bảo vệ
2. Kiểm tra tr ạng thái làm việc o
Hệ thống điều khiển O&M BTS Đầu tiên thực hiện lấy cảnh báo của tất cả các tr ạm “multi-site fault query”, r ồi thử loại bỏ các lỗi theo các mô tả cảnh báo và các gợ i ý khắc phục. Nếu bạn không thể khắc phục lỗi ngay thì cũng phải xác định đượ c nguyên nhân lỗi.
3. Thực hiện gọi thử calling test cho tất cả các khe thờ i gian.
Đào Đại Nghĩ a - Phòng K ỹ thuật TCT – Đà N ẵn g 05/2008
11