Voice over Internet Protocol (VoIP) là một công nghệ cho phép truyền thoại sử dụng giao thức mạng IP, trên cơ sở hạ tầng sẵn có của mạng internet. Voip là một trong những công nghệ viễn thông đang được quan tâm nhất hiện nay không chỉ đối với nhà khai thác, các nhà sản xuất mà còn cả với người sử dụng dịch vụ.
19 trang |
Chia sẻ: vietpd | Lượt xem: 3162 | Lượt tải: 1
Bạn đang xem nội dung tài liệu Tổng quan về voip, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
LỜI NÓI ĐẦU
Từ khi được phát minh vào năm 1875 bởi Graham Bell cho đến nay, điện thoại, đã phát triển qua rất nhiều bước khác nhau nhằm phục vụ cho những nhu cầu khác nhau của con người. Chúng ta không thể phủ nhận được lợi ích to lớn mà điện thoại mang lại cho cuộc sống của con người hiện đại như rút ngắn được thời gian liên lạc giữa người với người, tăng khả năng tiếp cận thông tin một cách nhanh chóng. Khi Internet ra đời và phát triển chúng ta có thêm nhiều ứng dụng khác như e-mail, chat… bên cạnh đó là sự xuất hiện của VoIP, một hình thức sử dụng mạng Internet để thiết lập cách kênh đàm thoại với chất lượng dịch vụ khá cao. Vậy VoIP là gì? Nguyên lý hoạt động của nó như thế nào? Ứng dụng trong cuộc sống ra sao? Qua bài này chúng ta sẽ lần lượt giải đáp các câu hỏi trên.
CHƯƠNG I: TỔNG QUAN VỀ VOIP
Giới thiệu chung về VoIP.
Voice over Internet Protocol (VoIP) là một công nghệ cho phép truyền thoại sử dụng giao thức mạng IP, trên cơ sở hạ tầng sẵn có của mạng internet. Voip là một trong những công nghệ viễn thông đang được quan tâm nhất hiện nay không chỉ đối với nhà khai thác, các nhà sản xuất mà còn cả với người sử dụng dịch vụ.
Voip có thể vừa thực hiện mọi loại cuộc gọi như trên mạng điện thoại kênh truyển thống (PSTN) đồng thời truyền dữ liệu trên cơ sở mạng truyền dữ liệu. Do các ưu điểm về giá thành dịch vụ và sự tích hợp nhiều loại hình dịch vụ nên voip hiện nay được triển khai một các rộng rãi.
Dịch vụ điện thoại voip là dịch vụ ứng dụng giao thức IP, nguyên tắc của voip bao gồm việc số hoá tín hiệu tiếng nói, thực hiện việc nén tín hiệu số, chia nhỏ các gói nếu cần và truyền gói tin này qua mạng, tới nơi nhận các gói tin này được ráp lại theo đúng thứ tự của bản tin, giải mã tín hiệu tương tự phục hồi lại tiếng nói ban đầu.
Các cuộc gọi trong voip dựa trên cơ sở sử dụng kết hợp cả chuyển mạch kênh và chuyển mạch gói. Trong mỗi loại chuyển mạch trên đều có ưu, nhược điểm riêng của nó. Trong kỹ thuật chuyển mạch kênh giành riêng cho hai thiết bị đầu cuối thông qua các node chuyển mạch trung gian. Trong chuyển mạch kênh tốc độ truyền dẫn luôn luôn cố định(nghĩa là băng thông không đổi) , với mạng điện thoại PSTN tốc độ này là 64kbps, truyền dẫn trong chuyển mạch kênh có độ trễ nhỏ.
Trong chuyển mạch gói các bản tin được chia thành các gói nhỏ gọi là các gói, nguyên tắc hoạt động của nó là sử dụng hệ thống lưu trữ và chuyển tiếp các gói tin trong nút mạng. Đối với chuyển mạch gói không tồn tại khái niệm kênh riêng, băng thông không cố định có nghĩa là có thể thay đổi tốc độ truyền, kỹ thuật chuyển mạch gói phải chịu độ trễ lớn vì trong chuyển mạch gói không quy định thời gian cho mỗi gói dữ liệu tới đích, mỗi gói có thể đi bằng nhiều con đường khác nhau để tới đích, chuyển mạch gói thích hợp cho việc truyền dữ liệu vì trong mạng truyền dữ liệu không đòi hỏi về thời gian thực như thoại, để sử dụng ưu điểm của mỗi loại chuyển mạch trên thì trong voip kết hợp sử dụng cả hai loại chuyển mạch kênh và chuyển mạch gói.
2. Các kiểu kết nối sử dụng VoIP
2.1 Computer to Computer:
Với 1 kênh truyền Internet có sẵn, Là 1 dịch vụ miễn phí được sử dụng rộng rãi khắp nơi trên thế giới. Chỉ cần người gọi (caller) và người nhận ( receiver) sử dụng chung 1 VoIP service (Skype,MSN,Yahoo Messenger,…), 2 headphone + microphone, sound card . Cuộc hội thoại là không giới hạn.
2.2 Computer to phone:
Là 1 dịch vụ có phí. Bạn phải trả tiền để có 1 account + software (VDC,Evoiz,Netnam,…). Với dịch vụ này 1 máy PC có kết nối tới 1 máy điện thoại thông thường ở bất cứ đâu ( tuỳ thuộc phạm vi cho phép trong danh sách các quốc gia mà nhà cung cấp cho phép). Người gọi sẽ bị tính phí trên lưu lượng cuộc gọi và khấu trừ vào tài khoản hiện có.
Ưu điểm : đối với các cuộc hội thoại quốc tế, người sử dụng sẽ tốn ít phí hơn 1 cuộc hội thoại thông qua 2 máy điện thoại thông thường. Chi phí rẻ, dễ lắp đặt Nhược điểm: chất lượng cuộc gọi phụ thuộc vào kết nối internet + service nhà cung cấp
2.3 Phone to Phone:
Là 1 dịch vụ có phí. Bạn không cần 1 kết nối Internet mà chỉ cần 1 VoIP adapter kết nối với máy điện thoại. Lúc này máy điện thoại trở thành 1 IP phone.
3. Các thành phần trong mạng VoIP:
Các thành phần cốt lõi của 1 mạng VoIP bao gồm: Gateway, VoIP Server, IP network, End User Equipments
Gateway: là thành phần giúp chuyển đổi tín hiệu analog sang tín hiệu số (và ngược lại).
VoIP gateway : là các gateway có chức năng làm cầu nối giữa mạng điện thoại thường ( PSTN ) và mạng VoIP.
VoIP GSM Gateway: là các gateway có chức năng làm cầu nối cho các mạng IP, GSM và cả mạng analog.
VoIP server : là các máy chủ trung tâm có chức năng định tuyến và bảo mật cho các cuộc gọi VoIP .Trong mạng H.323 chúng được gọi là gatekeeper. Trong mạng SIP các server được gọi là SIP server.
Thiết bị đầu cuối (End user equipments ) :Softphone và máy tính cá nhân (PC) : bao gồm 1 headphone, 1 phần mềm và 1 kết nối Internet. Các phần mềm miễn phí phổ biến như Skype, Ekiga, GnomeMeeting, Microsoft Netmeeting, SIPSet, ..
Điện thoại truyền thông với IP adapter: để sử dụng dịch vụ VoIP thì máy điện thoại thông dụng phải gắn với 1 IP adapter để có thể kết nối với VoIP server. Adapter là 1 thiết bị có ít nhất 1 cổng RJ11 (để gắn với điện thoại) , RJ45 (để gắn với đường truyền Internet hay PSTN) và 1 cổng cắm nguồn.
IP phone : là các điện thoại dùng riêng cho mạng VoIP. Các IP phone không cần VoIP Adapter bởi chúng đã được tích hợp sẵn bên trong để có thể kết nối trực tiếpvới các VoIP server
4. Các định nghĩa liên quan đến VOIP
VoIP – Voice over Internet Protocol (còn gọi là IP Telephony, Internet telephony và Digital Phone) – là hình thức truyền các cuộc đàm thoại qua Internet hay các mạng IP khác.
SIP – Session Initiation Protocol (Giao thức Khởi tạo Phiên) – là một giao thức phát triển bởi IETF MMUSIC Working Group và là tiêu chuẩn đề xuất cho việc khởi tạo, sửa đổi và chấm dứt một phiên tương tác người dùng bao gồm các thành tố đa phương tiện như phim, tiếng nói, tin nhắn nhanh, trò chơi trực tuyến và thực tại ảo.
PSTN – the public switched telephone network (mạng chuyển mạch điện thoại công cộng) – là nơi tập trung các mạng điện thoại chuyển mạch trên thế giới, cũng tương tự như Internet là nơi tập trung các mạng chuyển mạch gói IP công cộng trên thế giới.
ISDN – Integrated Services Digital Network (Mạng Tích hợp Dịch vụ Số) – là một loại hệ thống mạng điện thoại chuyển mạch, được thiết kế để cho phép truyền ở dạng số (ngược với tương tự) tiếng nói và dữ liệu qua dây điện thoại bằng đồng thông thường, đem lại chất lượng và kết quả cao hơn so với các hệ thống tương tự.
PBX – Private Branch eXchange (Tổng đài Chi nhánh Riêng - còn gọi là Private Business eXchange – Tổng đài Công ty Riêng) – là một tổng đài điện thoại sở hữu bởi công ty tư nhân, ngược với tổng đài được sở hữu bởi công ty truyền dữ liệu hay công ty điện thoại.
IVR – Trong ngành điện thoại, Interactive Voice Response (Phản hồi Tiếng nói Tương tác) – là một hệ thống bằng máy tính cho phép người ta, thường là người gọi điện thoại, chọn từ một bảng chọn dạng tiếng nói hoặc giao diện khác với một hệ thống máy tính.
DID – Direct Inward Dialing (Quay số vào Trực tiếp – còn gọi là DDI ở châu Âu) là một tính năng được công ty điện thoại cung cấp để sử dụng với hệ thống PBX của khách hàng, trong đó công ty điện thoại cấp phát một dải số, tất cả những số này đều nối với hệ thống PBX của khách hàng.
RFC – Request for Comments (Yêu cầu Nhận xét – số nhiều là RFCs) là một trong một loạt các tài liệu và tiêu chuẩn thông tin Internet được đánh số được các phần mềm.
Những điểm thuận lợi của VoIP so với PSTN.
Khi bạn dùng đường truyền PSTN,bạn phải trả cho thời gian sử dụng cho nhà cung cấp dịch vụ PSTN: sử dụng càng nhiều bạn phải trả càng nhiều.Thêm vào đó bạn không thể nói với người khác tại cùng thời điểm.
Với kỹ thuật VoIP, bạn có thể nói chuyện toàn thời gian với người bạn muốn(điều cần thiết là những người khác cũng phải kết nối internet tại cùng thời điểm),cho đến khi nào bạn muốn(không phụ thuộc vào chi phí) và thêm vào đó,bạn có thể nói chuyện với nhiều người tại cùng một thời điểm.Trước đây khi dựa vào giao tiếp thoại trên PSTN,trong suốt kết nối giữa hai điểm,đường kết nối chỉ dành riêng cho bên thực hiện cuộc gọi.Không có thông tin khác có thể truyền qua đường truyền này mặc dù vẫn thừa lượng băng thông sẵn dùng.
Nhưng ngày nay, điều đó đã không còn là vấn đề nữa, với sự phát triển nhanh chóng và được sử dụng rộng rãi của IP,chúng ta đã tiến rất xa trong khả năng giảm chi phí trong việc hỗ trợ truyền thoại và dữ liệu.Giải pháp tích hợp thoại vào mạng dữ liệu,và cùng hoạt động bên cạnh với hệ thống PBX hiện tại hay những thiết bị điện thoại khác đã đơn giản cho việc mở rộng khả năng thoại cho những vị trí ở xa.Traffic thoại thực chất sẽ được mang tự do(free)bên trên cơ sở hạ tầng và thiết bị phần cứng có sẵn.
Lợi ích của VoIP.
Một trong những tiên ích đáng kể nhất là giá thấp. Vì điện thoại IP truyền qua tài nguyên internet nên giá thành rất rẻ so với điện thoại PSTN. Đối với các công ty, việc chuyển sang dùng VoIP là một giải pháp giúp giảm thiểu cước phí điện thoại, nhất là điện thoại quốc tế, điện thoại đường dài. Hiện tại trong các công ty đều tồn tại 2 mạng, mạng điện thoại và mạng máy tính (intranet+internet). Việc quản lý 2 mạng này độc lập cũng dẫn đến nhiều tốn kém. Nếu chuyển sang dùng giải pháp VoIP thì công ty sẽ giảm chí phí cho việc quản lý bảo trì hệ thống mạng thoại và data. Dĩ nhiên các công ty phải chấp nhận một chi phí ban đầu để mua các telephoneIP, nhưng chi phí về lâu dài sẽ mang đến lợi ích đáng kể.
VoIP sử dụng kỹ thuật chuyển mạch gói (packet-switching - PS) của Internet để truyền tải dịch vụ thoại thay vì kỹ thuật chuyển mạch (circuit-switching - CS) như trong mạng điện thoại truyền thống (PSTN -Public switched telephone network). Vì VoIP sử dụng PS nên nó có nhiều tiện ích mà PS mang lại so với CS. Cụ thể, PS cho phép một vài cuộc thoại sử dụng một tài nguyên tương đương tài nguyên dành cho 1 cuộc thoại CS. Ví dụ một cuộc thoại 10 phút trên PSTN sử dụng hết liên tục 10 phút truyền thông tin (transmission) với băng thông 128Kbps. Nếu dùng VoIP để thực hiện cùng 1 cuộc thoại trên, thực tế bạn chỉ cần 3.5 phút truyền thông tin với băng thông 64Kbps. Như vậy bạn giải phóng 64Kbps trong 3.5 phút đấy cho người khác và cả 128Kbps cho 6.5 phút còn lại. Hình dưới đây minh họa sự khác nhau giữa PS và CS.Để thực hiện được sự hội tụ trên chúng ta cần các thiết bị mới hoặc có thể thích ứng các thiết bị hiện có (thông qua các adapter), và chúng ta có một mạng như sau:
CHƯƠNG II: CÁCH THỨC HOẠT ĐỘNG, NHÂN TỐ ẢNH HƯỞNG VÀ CÁC BỘ GIAO THỨC
VoIP hoạt động như thế nào?
Khi nói vào ống nghe hay microphone, giọng nói sẽ tạo ra tín hiệu điện từ, đó là những tín hiệu analog. Tín hiệu analog được chuyển sang tín hiệu số dùng thuật toán đặc biệt để chuyển đổi. Những thiết bị khác nhau có cách chuyển đổi khác nhau như VoIP phone hay softphone, nếu dùng điện thoại analog thông thường thì cần một Telephony Adapter (TA). Sau đó giọng nói được số hóa sẽ được đóng vào gói tin và gởi trên mạng IP.
Trong suốt tiến trình một giao thức như SIP hay H323 sẽ được dùng để điểu khiển (control) cuộc gọi như là thiết lập, quay số, ngắt kết nối… và RTP thì được dùng cho tính năng đảm bảo độ tin cậy và duy trì chất lượng dịch vụ trong quá trinh truyền.
1.1 Số hóa tín hiệu Analog
Biểu diễn tín hiệu tương tự(analog) thành dạng số (digital) là công việc khó khăn. Vì bản thân dạng âm thanh như giọng nói con người ở dạng analog do đó cần một số lượng lớn các giá trị digital để biểu diễn biên độ (amplitude), tần số(frequency) và pha (phase), chuyển đổi những giá trị đó thành dạng số nhị phân(zero và one) là rất khó khăn. Cần thiết cần có cơ chế dùng để thực hiện sự chuyển đổi này và kết quả của sự phát triển này là sự ra đời của những thiết bị được gọi là codec (coder-decoder) hay là thiết bị mã và giải mã.
Tín hiệu đện thoại analog (giọng nói con người) được đặt vào đầu vào của thiết bị codec và được chuyển đổi thành chuỗi số nhị phân ở đầu ra. Sau đó quá trình này thực hiện trở lại bằng cách chuyển chuỗi số thành dạng analog ở đầu cuối, với cùng qui trình codec.
Có 4 bước liên quan đến quá trình số hóa(digitizing) một tín hiệu tương tự(analog):
Lấy mẫu (Sampling)
Lượng tử hóa (Quantization)
Mã hóa (Encoding)
Nén giọng nói (Voice Compression)
Multiplexing: Ghép kênh là qui trình chuyển một số tín hiệu dồng thời qua một phương tiện truyền dẫn.
PAM(pulse-amplitude modulation)- điều chế biên độ xung
TDM(Time Division Multiplexing)-Ghép kênh phân chia theo thời gian:Phân phối khoảng thời gian xác định vào mỗi kênh, mỗi kênh chiếm đường truyền cao tốc trong suốt một khaỏng thời gian theo định kì.
FDM(Frequency Division Multiplexing)-Ghép kênh phân chia theo tần số: Mỗi kênh được phân phối theo một băng tần xác định, thông thường có bề rộng 4Khz cho dịch vụ thoại.
PCM(Pulse code modulation)- Điều chế theo mã: là phương pháp thông dụng nhất chuyển đổi các tín hiệu analog sang dạng digital ( và ngược lại) để có thể vận chuyển qua một hệ thống truyền dẫn số hay các quá trình xử lý số. Sự biến đổi này bao gổm 3 tiến trình chính: lấy mẫu, lượng tử hoá, mã hoá. Tiến trình này hoạt động như sau:
Giai đoạn đầu tiên cuả PCM là lấy mẫu các tín hiệu nhập (tín hiệu đi vào thiết bị số hoá), nó tạo ra một tuần tự các mẫu analog dưới dạng chuỗi PAM. Các mẫu PAM có dãi biên độ nối tiếp nhau, sau đó phân chia dải biên độ này thành một số giới hạn các khoảng. Tất cả các mẫu với các biên độ nào đó nếu mẫu nào rơi vào một khoảng đặc biệt nào thì được gán cùng mức giá trị cuả khoảng đó. Công việc này được gọi là “lượng tử hoá”. Cuối cùng trong bộ mã hoá, độ lớn của các mẫu được lương tử hoá được biểu diễn bởi các mã nhị phân
Lấy mẫu (Sampling)
Tín hiệu âm thanh trên mạng điện thoại có phổ năng lượng đạt đến 10Khz. Tuy nhiên, hầu hết năng lượng đều tập trung ở phần thấp hơn trong dải này. Do đó để tiết kiệm băng thông trong các hệ thống truyền được ghép kênh theo FDM và cả TDM. Các kênh điện thoại thường giới hạn băng tần trong khoảng từ 300 đến 3400Hz. Tuy nhiên trong thực tế sẽ có một ít năng lương nhiễu được chuyển qua dưới dạng các tần số cao hơn tần số hiệu dụng 3400Hz.
Do đó phổ tẩn số có thể được mở rộng đến 4Khz, theo lý thuyết Nyquist: khi một tín hiệu thì được lấy mẫu đồng thời ở mỗi khoảng định kì và có tốc độ ít nhất bằng hai lần phổ tần số cao nhất, sau đó nhũng mẫu này sẽ mang đủ thông tin để cho phép việc tái tạo lại chính xác tín hiệu ở thiết bị nhận. Với phổ tần số cao nhất cho thoại là 4000Hz hay 8000 mẫu được lấy trong một giây, khoảng cách giữa mỗi mẫu là 125 micro giây.
1.3 Lượng tử hoá (Quantization)
Tiến trình kế tiếp của số hóa tín hiệu tuần tự là biểu diễn giá trị chính xác cho mỗi mẫu được lấy. Mỗi mẫu có thể được gán cho một giá trị số, tương ứng với biên độ (theo chiều cao) của mẫu.
Sau khi thực hiện giới hạn đầu tiên đối với biên độ tương ứng với dải mẫu, đến lượt mỗi mẫu sẽ được so sánh với một tập hợp các mức lượng tử và gán vào một mức xấp xỉ với nó. Qui định rằng tất cả các mẫu trong cùng khoảng giữa hai mức lượng tử được xem có cùng giá trị. Sau đó giá trị gán được dùng trong hệ thống truyền. Sự phục hồi hình dạng tín hiệu ban đầu đòi hỏi thực hiện theo hướng ngược lại.
1.4 Mã hóa (Encoding)
Mỗi mức lượng tử được chỉ định một giá trị số 8 bit, kết hợp 8 bit có 256 mức hay giá trị. Qui ước bit đầu tiên dùng để đánh dấu giá trị âm hoặc dương cho mẫu. Bảy bít còn lại biểu diễn cho độ lớn; bit đầu tiên chỉ nữa trên hay nữa dưới của dãy, bit thứ hai chỉ phần tư trên hay dưới, bit thứ 3 chỉ phần tám trên hay dưới và cứ thế tiếp tục.
Ba bước tiến trình này sẽ lặp lại 8000 lần mỗi giây cho dịch vụ kênh điện thoại. Dùng bước thứ tư là tùy chọn để nén hay tiết kiệm băng thông. Với tùy chọn này thí một kênh có thể mang nhiều cuộc gọi dồng thời.
1.5 Nén giọng nói(Voice Compression)
Mặc dù kỉ thuật mã hóa PCM 64 Kps hiện hành là phương pháp được chuẩn hóa, nhưng có vài phương pháp mã hóa khác được sử dụng trong những ứng dụng đặc biệt. Các phương pháp này thực hiện mã hóa tiếng nói với tốc độ nhỏ hơn tốc độ của PCM, nhờ đó tận dụng được khả năng của hệ thống truyền dẫn số. Chắc hẳn, các mã hóa tốc độ thấp này sẽ bị hạn chế về chất lượng, đặt biệt là nhiễu và méo tần số.
Một số ví dụ hệ thống mã hóa tiếng nói tốc độ thấp:
CVSD( Continuously variable slope delta modulaton) Kỹ thuật này là một dẫn xuất của điều chế delta, trong đó một bit đơn dùng để mã hóa mỗi mẫu PAM hoặc lớn hơn hoặc nhỏ hơn mẫu trước đó. Vì không hạn chế bởi 8 bit, mã hóa có thể họat đông ở tốc độ khác nhau vào khỏang 20 Kps.
ADPCM( Adaptive differential PCM): Kỹ thuật này là một dẫn xuất của PCM chuẩn, ở đó sự khác biệt giữa các mẫu liên tiếp nhau được mã hóa, thay vì tất cả các mẫu điều được mã hóa, được truyền trên đường dây. CCITT có đề nghị một chuẩn ADPCM 32 Kps, 24 Kps, 16Kbs cho mã hóa tiếng nói.
Chuẩn PCM thì cũng được biết như chuẩn ITU G.711
Tốc độ G.711: 64 Kps=(2*4 kHz)*8 bit/mẫ
Tốc độ G.726: 32 Kps=(2*4 kHz)*4 bit/mẫ
Tốc độ G.726: 24 Kps=(2*4 kHz)*3 bit/mẫ
Tốc độ G.726: 16 Kps=(2*4 kHz)*2 bit/mẫu
Packetizing voice
Mỗi một khi giọng nói đã được số hoá và được nén lại, nó phải được chia thành những phần nhỏ, để đặt vào gói IP, VoIP thì không hiệu qua cho những gói tin nhỏ, trong khi những gói tin lớn thì tạo ra nhiều độ trễ, do ảnh hưởng của vài loại header mà kích thưóc cuả dữ liệu thoại(voice data ) cũng sẽ ảnh hưởng. Ví dụ header cuả IP, UDP, RTP là 40 byte, nếu gói tin voice cũng chỉ khoảng 40 byte thì hoàn toàn không hiệu quả, kích thước gói tin lớn nhất có thể trong môi trường Ethernet là 1500 byte, dùng 40 byte cho header còn lại 1460 byte có thể sử dụng cho phần dữ liệu thoại, tương đương với 1460 mẫu(samples) không được nén hay thời gian để đặt phần dữ liệu vào gói tin. Nếu gói bị mất nhiều hay đến đích không đúng thứ tự sẽ làm cho cuộc thoại bị ngắt quãng.
Thông thường, cần khoảng 10us đến 30 us (trung bình là 20us) để đặt dữ liệu thoại vào bên trong gói tin, ví dụ phần dữ liệu thoại(voice data) vơí kích thước 160 byte không nén cần khoảng 20us để đặt phần dữ liệu thoại vào bên trong gói tin. Số lượng dữ liệu thoại bên trong gói tin cần cân bằng giữa sự hiệu quả trong sử dụng băng thông và chất lượng của cuộc thoại.
2. Các nhân tố ảnh hưởng đến chất lượng thoại Trên VoIP.
Chất lượng của âm thanh được khôi phục qua mạng điện thoại là mục tiêu cơ bản của dịch vụ, mặc dù các chỉ tiêu chuẩn đã được ITU phát triển. Có 3 nhân tố có thể ảnh hưởng sâu sắc tới chất lượng của dịch vụ thoại:
2.1 Trễ:
Hai vấn đề gây ra bởi sự trễ đầu cuối trong một mạng thoại là tiếng vang và chồng tiếng. Tiếng vang trở thành vấn đề khi trễ vượt quá 50 ms. Đây là một vấn đề chất lượng đáng kể, nên các hệ thống VoIP phải kiểm soát và cung cấp các phương tiện loại bỏ tiếng vang. Hiện tượng chồng tiếng (giọng người này gối lên giọng người kia) trở nên đáng kể nếu trễ một chiều (one-way delay) lớn hơn 250 ms.
2.2 Sự biến thiên độ trễ (Jitter ):
Jitter là sự biến thiên thời gian trễ gây nên bởi sự trễ đường truyền khác nhau trên mạng. Loại bỏ jitter đòi hòi thu thập các gói và giữ chúng đủ lâu để cho phép các gói chậm nhất đến để được phát lại (play) đúng thứ tự, làm cho sự trễ tăng lên.
2.3 Mất gói:
Mạng IP không thể cung cấp một sự bảo đảm rằng các gói tin sẽ được chuyển tới đích hết. Các gói sẽ bị loại bỏ khi quá tải và trong thời gian tắc nghẽn. Truyền thoại rất nhạy cảm với việc mất gói, tuy nhiên, việc truyền lại gói của TCP thường không phù hợp. Các cách tiếp cận được sử dụng để bù lại các gói mất là thêm vào cuộc nói chuyện bằng cách phát (play) lại gói cuối cùng, và gửi đi thông tin dư. Tuy thế, sự tổn thất gói trên 10% nói chung là không chấp nhận được.
Sự duy trì chất lượng thoại chấp nhận được bất chấp sự thay đổi trong hoạt động của mạng (như tắc nghẽn hay mất kết nối) đạt được nhờ những kỹ thuật như nén tiếng, triệt im lặng . Một số sự phát triển trong những năm 90, nhất là trong xử lý tín hiệu số, các chuyển mạch mạng chất lượng cao đã được phối hợp để