Chương 2: Kiến trúc trong hệ phân tán Họ tên SV: Đặng Mạnh Trườ ng. ng. MSSV: 20134209 Chức năng các tầng trong mô hình OSI - Physical Layer (tầng vật lý): Truyền tải bit trên đườ ng ng truyền vật lý - Data-link layer (tầng liên k ết dữ liệu): Truyền tải các khung d ữ liệu (frame) giữa 2 máy tính - Network layer (tầng mạng): Tìm đường đi cho dữ liệu đến các đích khác nhau trong mạ ng - Transport layer (tầng giao vận): Đảm bảo truyền tải dữ liệu - Session Layer (tầng phiên): Cho phép các ứng dụng thiết lậ p, sử dụng và xóa các kênh giao tiế p giữa chúng - Presentation Layer (tầng bi ểu diễn): Đảm bảo các máy tính có ki ểu định dạng dữ liệu khác nhau vẫn có thể trao đổi thông tin cho nhau - Application Layer (tầng ứng dung): Cung c ấ p các ứng dụng truy xu ất đến các dịch vụ mạng Ví dụ: Khi chúng ta đổi đị a chị IP máy t ừ IPv4 sang IPv6 thì vi ệc truy cậ p vẫn không b ị ảnh ng gì hưở ng
Câu 1:
Cho ví d ụ và phân tích m ột mô hình ki ến trúc thuê bao/xu ất bản (publish/subscribe) Ví dụ: Trang thông tin tuy ển dụng lậ p trình viên (LTV) 1 số trang tuyển dụng LTV (itviec,….) phân loại thông tin tuy ển dụng theo ngôn ng ữ lậ p trình (ví dụ: Java, C,Python,….). Một LTV đang tìm việ c sẽ đăng ký tài khoả n và ch ọn những ngôn ng ữ lậ p trình mà mình bi ết. Thông tin tuy ển dụng, sau khi đượ c nhà tuyển dụng gửi tớ i admin, s ẽ đượ c admin đăng lên kèm theo ngôn ngữ lập trình đượ c yêu cầu. Tất cả người dùng đã chọ n ngôn ng ữ đó sẽ đượ c thông báo v ề tin tuyển dụng đó. Câu hỏi 2:
Ở đây - Publisher là admin c ủa trang tuyển dụng LTV - Topic là ngôn ng ữ lậ p trình - Subscriber là những ngườ i dùng trên trang Sự khác nhau gi ữa phân tán d ọc và phân tán ngang là gì? - Phân tán dọc (vertical distribution): refers to the distribution of the different layers in a multitiered architecture across multiple machines (chia thành nhiều tầng, phân chia theo ch ức năng). Nhượ c điểm: chi phí truyền thông l ớ n - Phân tán ngang (horizontal distribution): deals with the distribution of a single layer across multiple machines, such as distributing a single database. (ch ỉ có 1 t ầng, phân b ố theo tải). Nhượ c điểm: Mất nhiều thời gian để truy cậ p do không có phân t ầng riêng bi ệt Tham khảo: Distributed Systems: Principles and Paradigms (Tanenbaum, van Steen) Câu hỏi 3:
Câu hỏi 4:
Phân tích ưu nhược điể m của kiến trúc tậ p trung và kiến trúc không
tậ p trung. Kiến trúc tậ p trung: - Ưu điểm: Tăng năng suấ t thông qua vi ệc sử dụng các user-interface, có hiệu quả về chi phí, tăng cường lưu trữ dữ liệu, k ết nối r ộng rãi và các d ịch vụ ứng dụng đáng tin cậ y. Cải thiện việc chia sẻ dữ liệu, tích hợp đượ c các dịch vụ, chia sẻ tài nguyên gi ữa các nền tảng khác nhau, đảm bảo tính toàn v ẹn của cơ sở d dữ liệu, khả năng xử lý dữ liệu ở m mọi nơi, dễ dàng bảo trì bảo mật. - Nhược điểm: Có thể gây ra tình tr ạng máy ch ủ quá tải khi nhi ều client truy c ậ p; khi 1 máy chủ server quan tr ọng bị lỗi, các yêu cầu khác từ phía client s ẽ không được đáp ứ ng
Kiến trúc không t ậ p trung:
Ưu điểm : Dễ cài đặt và cấu hình; tất cả tài nguyên và n ội dung đượ c chia sẻ giữa tất cả các peer, không phụ thuộc peer khác. Ngườ i dung có th ể kiểm soát việc chia sẻ tài nguyên c ủa họ. Chi phí b ảo mật thấ p so vớ i kiến trúc tậ p trung - Nhược điểm: Khó qu ản lý, ph ục hồi sao lưu dữ liệu khó khăn -
Trong m ột mạng overlay có cấu trúc, các thông điệp được đị nh tuyến dựa theo hình tr ạng mạng (topology). Nhược điể m quan tr ọng của hướ ng tiế p cận này là gì? - Độ tr ễ lớn, cũng vậ y, vì truyền qua 1 nút m ất 1 khoảng thời gian để nó xác định đị nh tuyến (tăng độ phức tạ p) - Do liên k ết giữa các node là liên k ết logic nên không th ấy đượ c liên k ết vật lý bên dướ i Câu hỏi 5:
Câu hỏi 6:
Vấn đề nảy sinh:
Nếu trong tiến trình P_i+1 nào đó xuât hiệ n lỗi không tr ả lời đượ c tiến trình Pi thì s ẽ dẫn tớ i treo toàn bộ hệ thống. Ngoài ra vớ i kiến trúc đa tầng, thời gian đáp ứng request (ph ản hồi) sẽ lâu hơn do phả i mất thờ i gian chuyển qua lại nhiều tầng. 1 vấn đề khác nảy sinh là hiệu năng bị ảnh hưở ng từ các tầng khác nhau
Câu hỏi 7:
Giải thuật này nhìn chung là t ốt, vì: Khi so sánh v ớ i các thuật toán định tuyến như Distance -Vector (DV) và Link-State (LS), ta th ấy là DV và LS s ử dụng thông tin v ề hình tr ạng mạng, nên v ớ i những mạng có hình tr ạng mạng thay đổ i liên tục, vớ i DV và LS s ẽ cần cậ p nhật thông tin liên t ục, trong khi giải thuật đượ c nêu ra không ph ụ thuộc vào hình tr ạng mạng mà chỉ phụ thuộc vào hash function (hàm băm) từ cặ p (key,value) tớ i không gian t ọa độ.
Mặt khác, việc phân chia không gian t ọa độ thành các vùng hoàn toàn ph ụ thuộc vào hash function (hàm băm) mà không liên quan gì tớ i khoảng cách vật lý/ IP hop gi ữa các bộ định tuyến, nên vớ i giải thuật đượ c nêu, 1 b ộ định tuyến được coi là “hàng xóm gầ n mình nh ất” có thể lại khá xa v ề mặt vật lý và như vậ y IP hop s ẽ lớ n. Trong [1] các tác gi ả đề xuất 1 số metric định tuyến đặc biệt để đối phó vớ i vấn đề này. Tham khảo: [1] Ratnasamy et al (2001). “A scalable Conte nt-Addressable Network”. In Proceedings of ACM SIGCOMM 2001