Tez No İndirme Tez Künye Durumu
557399
Traffic and mobility aware delay modeling for software-defined networks (SDN) / Yazılım tanımlı ağlar için trafik ve hareket duyarlı gecikme modeli
Yazar:MÜGE ÖZÇEVİK
Danışman: DOÇ. DR. BERK CANBERK
Yer Bilgisi: İstanbul Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı / Bilgisayar Mühendisliği Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Bölgesel bilgisayar ağları = Regional computer networks
Onaylandı
Doktora
İngilizce
2019
174 s.
Cisco tarafından yayınlanan teknik rapora göre (Visual Networking Index, VNI), mobil cihazlardan üretilen veri trafiğinin 2021 yılında 49.0 exabayt seviyesine ulaşması beklenmektedir. Bu aşırı trafik yoğunluğu altında, mobil kullanıcıları memnun edebilmek için bu kullanıcıların 5. Nesil (5th Generation, 5G) hizmetlerdeki taleplerine odaklanılmalıdır. Belirtilen bu 5G hizmetleri, Ultra-Güvenilir Düşük Gecikme İletişimi (Ultra-Reliable Low Latency Communication, URLLC) ve Genişletilmiş Mobil Bant (enhanced Mobile Broadband, eMBB) olarak adlandırılır. URLLC hizmetleri araç ağlarında spesifik bir uygulama olan araç takımı (vehicle platoon) ile örneklendirilebilir. Araçların takım halinde ilerlemesi; farklı yol dinamiklerinde bile yakıt ve trafik verimliliğini arttırır ve takım içerisindeki araç arası mesafeleri kontrol ederek sürüş güvenliğini sağlar. Araç ile ağ altyapısı (Vehicle to Infrasructure, V2I) arasındaki 5G bağlantısı sayesinde, takım içerisindeki lider araç kontrol merkezinden trafik akış kontrolü için dinamik kuralları alır ve takım içerisindeki kendisini takip eden araçlara manevra için gerekli verileri IEEE 802.11p bağlantısı üzerinden araçtan araca (Vehicle to Vehicle, V2V) ile iletir. Bu servis, güvenilir veri iletişimi ve katı gecikme (strict latency) şartı gerektirir. Diğer bir yandan; eMBB hizmetleri, eğitim ve oyunlarda kullanılmak üzere 360 derecelik video akışı sağlayan artırılmış ve sanal gerçeklik (Augemented Reality, AR - Virtual Reality, VR) deneyimleri ve yarının otonom arabaları için gerekli veri iletimi olarak tanımlanır. Bu servis; 1080p, 2K, 4K, ve 8K kalitesinde video içeriği sunabilmektedir. Eğlence amaçlı kullanım alanlarında veri iletimindeki gecikme çok önemli olmasa da, otonom araçlarda eMBB servisi hayati rol üstlendiği için çok düşük gecikme ile hizmet vermelidir ve aracın hareketliliği boyunca 5G bağlantısında hiçbir kesinti olmamalıdır. Uluslarası mobil iletişim (International Mobile Communications, IMT-2020) raporuna göre, eMBB ve URLLC servislerinin uçtan uca gecikmesinin (end-to-end Delay, e2eDelay) azaltılarak en fazla birkaç milisaniye (a few miliseconds) olacak şekilde tutulması gerekmektedir. Burada, uzak sunucudan hareketli kullanıcıya aşağı yönde (downlink) akıtılan trafiğin uçtan uca gecikmesi Veri (Data) ve Kontrol (Control) katmanları dikkate alınarak ölçülür. Veri katmanı, Çekirdek (Core) ve Kenar (Edge) ağlarındaki her bir cihazda gerçekleşen kuyrukta bekleme ve işleme süresi olarak modellenmektedir. Kontrol katmanı ise, merkezi kontrolörde hareketlilik prosedürlerinin koşulması için beklenilen işlem süresini içerir. Bu tezde; trafik yoğunluğu ve hareketlilikten doğan problemler düşünülerek, URLLC ve eMBB servisleri için yeni bir uçtan uca gecikme modeli üzerine çalışılmaktadır. Bu nedenle; bu durum kendimize aşağıdaki soruyu sormamıza neden olmaktadır: Aşırı-yoğun ağlarda (Ultra-Dense Networks, UDN) artan trafik heterojenliği ve yoğunluğu altında eMBB ve URLLC hizmetleri için uçtan uca gecikme nasıl en aza indirilir? Bu tezde; eMBB ve URLLC hizmetleri için 5G ağlarında en aza indirilmiş uçtan uca gecikmeyi sunan trafik heterojenliğine ve hareketliliğine duyarlı bir Yazılım Tanımlı Ultra Yoğun Ağ (Software-Defined Ultra-Dense Networks, SDUN) yapısı önerilmektedir. Yukarıda bahsedilen araştırma sorusu, yalnızca önerilen bu SDUN yapısı ile ele alınabilir. Bu yapı topolojiye herhangi bir fiziksel temas gerektirmeden merkezi bir izleme ile dinamik bir şekilde veri katmanını kontrol eder. SDUN, UDN topolojisinde trafik heterojenliğini ve aşırı trafik yoğunluğunu dikkate alan bir yaklaşım sunmak için kenar ve çekirdek ağlarını ortak bir şekilde değerlendirir. Bu konu tezde, şu alt modüllerde detaylı bir şekilde incelenmektedir: Trafik Heterojenliği Yönetimi (Traffic Heterogeneity Management), Trafik Yoğunluğu Yönetimi (Traffic Intensity Management), eMBB servisleri için Devredim Yönetimi (Handover Management for eMBB Services) ve URLLC servisleri için Devredim Yönetimi (Handover Management for URLLC services). Bu alt modüllerin ayrıntılarından aşağıdaki paragraflarda sırasıyla bahsedilmektedir. Trafik heterojenliği yönetimi modülünde; TCP sıkışıklık kontrol mekanizmasındaki kaybolan her paketin zaman aşımı için eklenen ekstra hatta çıkma süresi ve bundan dolayı diğer paketlerin artan kuyrukta bekleme süreleri nedeniyle, UDP (eMBB) trafiğinin TCP (URLLC) trafiğini sıkıştırdığına inanıyoruz. Bu durum; UDP üzerinde taşınan trafiğin bant genişliğini diğer trafik tipiyle dengeli olmayan bir şekilde TCP'nin kullanması beklenen kısımları da kullanmasından kaynaklanmaktadır. Bu nedenle; ağdaki her cihaz içerisinde hizmet verilen UDP ve TCP üzerinde taşınan trafik sayılarının oranı olarak tanımladığımız trafik heterojenliği parametresi önemli hale gelmektedir. 3. Nesil Ortaklık Projesinin (3rd Generation Partnership Project, 3GPP) yayımladığı sürüm 14 teknik özelliklerine göre, geleneksel kendi kendini organize edebilen ağlarda (Long Term Evolution-Self Organize Networks, LTE-SON) komşu baz istasyonları arasındaki trafik yoğunluğu dengelenirken heterojenlik oranını dikkate alınmaz. İncelenen TCP trafiğinin uçtan uca gecikmesini en aza indirebilmek için, her baz istasyonunun trafik yoğunluğu ve trafik heterojenliği parametreleri dikkate alınarak en uygun trafik yolu belirlenmelidir. Bunun için; 5G ağlarında SDUN tabanlı yazılımlaştırma yapısı öneriyoruz ve bunu üç temel katkı çerçevesinde sunuyoruz. Bunlar; topoloji grafının sanallaştırılması, trafik yoğunluğu ($\rho_j$) ve trafik heterojenliği (H\textsubscript{j}) parametrelerine göre uçtan uca gecikme (e2eDelay) optimizasyonu, ve yeni kuyruk teorisi tabanlı OpenFlow ağ anahtar modeli olarak tanımlanmaktadır. Öte yandan; merkezi SDUN kontrolör yapısının darboğaz sorununu hizmet verme süresini hızlandıracak şekilde çözmek için üç yeni öneri sunmaktayız. Bu öneriler ile uçtan uca gecikme optimizasyon algoritmasını ve en kısa yol algoritmasını parallel koşabilecek şekilde tasarlamış oluyoruz. Bu süreçte uçtan uca gecikme parametresi, Kontrol (Control Plane) ve Veri katmanı (Data Plane) etkisi düşünülerek bir matematiksel kapalı form çerçevesinde yeniden düzenlenmiştir. Sonuç olarak; önerilen SDUN tabanlı e2eDelay modeli, LTE-SON ve geleneksel LTE mimarilerine göre \%74 ve \%98 oranında daha az uçtan uca gecikme ile incelenen TCP akışına hizmet verebilmektedir. Trafik yoğunluğu yönetimi modülünde ise; araç takımı ağlarında (platoon networks) otonom araçların güvenilir veri iletimi ve çok düşük gecikme ihtiyacı olduğuna inanıyoruz. Bunlar, URLLC 5G spesifikasyonu altında temel iki ihtiyaç olarak belirtilmektedir. Tezin bu modülünde, URLLC 5G servisi üzerine odaklanılarak uçtan uca gecikmeyi en aza indirmek için Yazılım-Tabanlı Araç Takım Ağı (Software-Defined Platoon Network, SDPN) tasarlanmıştır. Bu SDPN yapısı, araç takım ağlarında V2V ve V2I bağlantılarını göz önüne alarak Karışık Tamsayılı Doğrusal Problem (Mixed-Integer Linear Problem, MILP) ile uçtan uca gecikme optimizasyonu tanımlamaktadır. Ancak önerilen bu problemin çözümü polinomsal zamanda çözülemez ve NP (Non-deterministic Polynomial) karmaşıklıktadır. Bu optimizasyonun en az sürede çözülebilmesi için, problem temel iki alt-seviyeye ayrılmıştır: Araç Takımı Oluşturma (Platooning) ve Yük Dengeleme (Load Balancing). Seviye 1'de (Level 1), araç takımı oluşturmak için araç grafın en uygun küme örtüsünü (set cover) bulan yeni Merkezi Küme Örtüsü algoritması (Centralized Set Cover algorithm) önerilmektedir. Seviye 2'de (Level 2); makro (macrocells) ve küçük hücre (smallcells) katmanları arasındaki trafik yoğunluğu geçişi, uçtan uca gecikme göz önünde bulundurularak optimize edilmekte ve bunun için yeni Yük Dengeleme algoritması (Load Balancing algorithm) önerilmektedir. SDPN kontrolörünü daha da hızlandırmak için, makro ve küçük hücrelerin yük eşiklerini (load thresholds, $\rho_{m,s}$) dinamik olarak belirleyen bir analitik metodoloji tanımlanmıştır. Bu sayede, etkin maliyetli bir SDPN yapısı elde edilmiştir. Performans değerlendirmesine göre ise, önerilen SDPN yapısı uçtan uca gecikmeyi 3.5 milisaniye altında tutarak geleneksel yapıya göre \%45 iyileştirme sağlamaktadır ve topolojide \%70 daha çok trafik yüküne başarılı bir şekilde hizmet verebilmektedir. EMBB servisleri için devredim (handover) yönetimi modülünde ise; günümüz devredim prosedürü Sanal Geliştirilmiş Paket Çekirdeğinde (virtual Evolvel Paket Core, vEPC) hala üç durumlu olarak gerçeklendiği için, 5G gecikme ihtiyacını istenilen ölçüde karşılayamadığına inanıyoruz. Burada, istenilen uçtan uca gecikme 4 milisaniyenin altında olmalıdır ve eMBB servisinin hareketliliği sırasında herhangi bir bağlantı kesintisi yaşanmamalıdır. Bu ihtiyaç doğrultusunda, uçtan uca gecikmenin Markov modeline odaklanılmıştır. Bu gecikme, aşağı yönde akıtılan eMBB trafiğinin kenar (Edge) ve çekirdek (Core) ağındaki gecikmeleri dikkate alınarak hesaplanabilir. Burada aşırı yoğun trafik altında, kenar ağına teslim edilebilen paket sayısının azalması nedeniyle kenar gecikmesi çekirdek ağından kötü yönde etkilenmektedir. Bu nedenle Hedef Baz İstasyonunu (target eNodeB, TeNB) belirlerken sadece kenar ağını dikkate almak uçtan uca gecikme açısından yanlış tercihe neden olabilir. Bu problemi aşabilmek için, kenar ve çekirdek gecikmeleri ortak olarak ele alınması önerilmektedir. Bu gecikmeler devredim prosedürünün her aşamasından farklı şekilde etkilenmektedir. Bu aşamalar (1) hazırlanma (preparation), (2) gerçekleme (execution), ve (3) sonlandırma (conclusion) olarak adlandırılır. Kenar ve çekirdek ağını ortak şekilde en aza indirebilecek ve devredim aşaması (2)'yi tamamiyle prosedüründen kaldırabilecek tek yapının merkezi bir bakış açısıyla devredim yönetimi sunan yeni bir SDUN yapısı olduğuna inanıyoruz. SDUN yapısı; ağı merkezi olarak izleme ile devredimin en uygun zamanda tetiklenmesini; ve sonrasında, önerilen optimizasyon formülüne göre en uygun TeNB'nin belirlenmesini ve buna uygun en kısa çekirdek yolunun OpenFlow ağ anahtarlarının yoğunluğuna göre çizilmesini sağlar. Bu SDUN yapısı, önerilen Paralel Kenar Gecikme Optimizasyonu (Parallel Edge Delay Optimization) ve Paralel En Kısa Gecikme Yolu (Parallel Shortest Delay Path) algoritmaların paralel koşturulabilen yapısı sayesinde uygun maliyetli hale getirilmiştir. Performans değerlendirmesinde ise; ilk olarak SDUN QUIC tabanlı HTTP/3 1080p çözünürlüğündeki video trafiği akıtan spesifik eMBB uygulaması ile gerçeklenmiştir. İkinci aşamada ise MATLAB ortamında daha çok OpenFlow ağ anahtarına sahip topolojiler için sistem seviyesinde simüle edilmiştir. Sonuçlara bakıldığında önerilen SDUN yapısı 5G gereksinimlerini şu şekilde karşılamaktadır: Kullanıcı başına önerilen yapı çekirdek ağındaki gecikmeyi yaklaşık 7.16 milisaniye azaltmıştır. Bununla beraber kenar gecikmesini sıfır seviyesi (zero-latency level) altında tutarak geleneksel UDN yapısının devredim yönetimine göre \%20 daha fazla paket teslim oranı (delivery ratio) sağlamaktadır. Diğer bir yandan; SDUN yapısının maliyeti O(k\textsuperscript{4}log\textsuperscript{2}(k)) olarak analiz edilmiş ve maliyet verimliliğinin kabul edilebilir ekstra \%8 sanal hafıza kullanımı yanında \%50 arttığı gözlemlenmiştir. URLLC servisleri için devredim yönetimi modülünde ise; uçtan uca hareketliliği ele alabilmek ve araç ağlarının operasyonel ve sermaye harcamalarını (OPEX/CAPEX) en aza indirgeyebilmek için ağ servis zincirleri Ağ Fonksiyon Sanallaştırması (Network Function Virtualization, NFV) ve vEPC ile gerçeklenmektedir. Ancak; ultra-yoğun ağlarında fazla sayıdaki yol kenarı ünitesi (Road Side Unit, RSU) nedeniyle takım halinde seyir eden araçların liderinin artan devredim isteği SDUN kontrolörünü dar boğaz haline getirmektedir ve kontrolörün lidere vereceği cevap süresi artmaktadır. Bu noktada şu sorunun cevabını araştırmaktayız: URLLC servisleri için 5G gereksinimi olan uçtan uca gecikme nasıl en aza indirgenebilir? Bu nedenle; merkezi yaklaşımını bozmadan yeni bir SDUN/NFV kontrolörü tabanlı devredim yönetimi önerilmektedir. Bunun için Küçük Hücre Sanal Ağ Fonksiyonu (Smallcell virtual Network Function, SvNF) ve Makro Hücre Sanal Ağ Fonksiyonu (Macrocell virtual Network Function, MvNF) olmak üzere, yol kenarı ünitesi olarak hizmet veren baz istasyonlarının iki yeni rol tanımı yapılmıştır. Bunlardan ilki yol kenarı ünitesinin fiziksel kapsama alanı içerisindeki araca küçük hücre olarak hizmet vermesi, diğer ise yol kenarı ünitesinin mantıksal kapsama alanı içerisindeki araca gelen veriyi komşu baz istasyonuna yönlendirerek merkezi SDUN kontrolörüne herhangi bir devredim isteği gerektirmeden hizmet vermesidir. Kuyruk teorisiyle modellenen uçtan uca gecikme, önerilen devredim tetikleme algoritması ile SDUN kontrolöründe periyodik olarak izlenmektedir. Bu algoritma, MvNF ve SvNF içeren ağ hizmet zincir uzunluğunun 5G gereksinimini aştığı noktada Devredim Ağ Fonksiyonunu (Handover Network Function) tetikler ve ilgili aracın bağlı olduğu yol kenarı ünitesinden komşu olana doğru devredimini gerçekleştirir. Performans değerlendirmesine göre; önerilen SDUN/NFV mimarisi daha az devredim isteği oluşturarak ve ölçeklenebilirliğini arttırarak SDUN merkezi yapısının korunmasını sağlamıştır. Önerilen algoritma en fazla 7 ağ fonksiyonu içeren servis zincirine izin vererek uçtan uca gecikmeyi yaklaşık 12 milisaniye azaltmıştır.
According to the Cisco Visual Networking Index (VNI) report, the data traffic generated from mobile devices is expected to reach 49.0 exabytes per month in 2021. To handle this increase, there is a need to focus on mobile user requirements for specific 5th Generation (5G) services. These applications are newly called as an Ultra-Reliable Low Latency Communication (URLLC) and an Enhanced Mobile Broadband (eMBB). URLLC services can be exemplified with a specific application for fully automated driving in a platoon. It decreases fuel consumption in different road dynamics, enhances traffic efficiency, and ensures safety by controlling the space between vehicles. Thanks to the Vehicle to Infrastructure (V2I) communication over 5G links, the leader vehicle takes the dynamic rules from the remote control center. It forwards maneuvers data to the followers in a platoon via the Vehicle to Vehicle (V2V) communication over IEEE 802.11p links. This service requires reliable data transfer and strict latency in downlink traffic flow during mobility. On the other hands; eMBB services are the next generation of entertainment experiences such as Augmented Reality (AR) and Virtual Reality (VR) in 360-degree video streaming for games, education, training and also tomorrows' services such as autonomous driving. It offers 1080p, 2K, 4K and also 8K video quality. Although entertainments do not need strict latency, the eMBB service for autonomous driving requires very-low latency due to directly having a vital role and it does not desire any interruption on the 5G connection during mobility. According to International Mobile Communications (IMT-2020), eMBB and URLLC services need 5G reduced latency requirement; i.e. keeping End-to-End Delay (e2eDelay) in a few milliseconds. It is calculated as Data and Control planes for downlink traffic from the remote host to mobile end-user. Data plane is modeled by queuing and processing delays in Core and Edge networks; whereas Control plane has a processing time of centralized controller due to signaling during mobility procedures. In this thesis, we study a new e2eDelay model while considering the traffic and mobility challenges of URLLC and eMBB services. Therefore; this leads us to investigate the following question: How to reach 5G reduced-latency for eMBB and URLLC services under huge traffic heterogeneity and intensity in mobile Ultra-Dense Networks (UDN)? In this thesis; we propose a traffic and mobility aware Software-Defined Ultra-Dense Network (SDUN) that offers 5G reduced e2eDelay for eMBB and URLLC services. The aforementioned research question can be only handled by the SDUN framework via network-centric monitoring and reconfigurable data plane without any physical touch. SDUN offers an approach by considering traffic heterogeneity and huge traffic intensity in UDN. Here, it proposes joint consideration of edge and core networks. These are studied in following sub-modules separately: Traffic Heterogeneity, Traffic Intensity, Handover Management for eMBB and Handover Management for URLLC services. The details are summarized in the following paragraphs; respectively. In Traffic Heterogeneity Management, we believe that foreground TCP (URLLC) traffic flow is 'squeezed' by UDP (eMBB) background. The reason for it is increasing waiting time in a queue of each forwarding device and extra transmission delay for each timeout in TCP congestion control mechanism. Here, traffic Heterogeneity is defined by the rate between the number of UDP and TCP traffic flows. According to the 3rd Generation Partnership Project (3GPP) Release 14, conventional Long Term Evolution - Self Organize Networks (LTE-SON) does not consider Heterogeneity rate of traffic flows while balancing the load between neighbor eNodeBs (eNBs). In order to reduce e2eDelay of foreground TCP traffic flow, an optimal path should be selected by considering both load Intensity and traffic Heterogeneity level of eNBs. To do this, we propose a SDUN-based softwarization approach brought by 5G networks with three-fold contributions: virtualization of topology graph (G), e2eDelay optimization which is run in terms of both load Intensity ($\rho_j$) and Heterogeneity rate (H\textsubscript{j}), and a novel Queuing Theory based OpenFlow (OF) switch model. However; due to being a bottleneck in centralized SDUN-Controller, we propose to accelerate the processing rate with novel three heuristics including shortest path and e2eDelay optimization algorithms running in a parallel manner. More specifically, this process is combined into a novel closed-form expression of e2eDelay in two main parts: Data and Control plane effects. As a result, the proposed SDUN-based e2eDelay model serves foreground TCP traffic flow 74\% and 98\% less e2eDelay than LTE-SON and conventional LTE. In Traffic Intensity Management, we believe that autonomous driving in a platoon network requires reliable data transfer and strict latency on downlink traffic. These two requirements have been addressed in 5G under the URLLC specification. In this thesis, we focus on this 5G service, and we design a novel Software-Defined Platoon Network (SDPN) by optimizing the e2eDelay. Our SDPN defines the e2eDelay optimization as a Mixed Integer Linear Problem (MILP) which considers both the V2V and V2I links in a platoon. Here, due to the NP-hard characteristic of our MILP optimization and to reduce the computational complexity of the optimization at the same time, we divide the problem space into two-sub levels: Platooning and Load Balancing. In Level 1, we find the optimum set cover of vehicles by building platoons using a novel Centralized Set Cover algorithm. In Level 2; by considering the transactions between the macrocell and small cell tiers, we balance the traffic load via a novel Load Balancing algorithm. To further accelerate our SDPN controller, we define an analytical methodology to dynamically manipulate load thresholds ($\rho_{m,s}$) for macrocell and small cell tiers in Level 2. According to performance evaluation, our SDPN serves nearly 70\% more traffic load in a topology by keeping e2eDelay under 3.5 milliseconds with a 45\% improvement over the conventional approach. In Handover Management for eMBB services, we believe that handover execution has still been damaging 5G latency requirement due to having three states in virtual Evolved Packet Core (vEPC). Here, the desired e2eDelay should be less than 4 milliseconds without any mobility interruption on an eMBB service of vEPC. To handle this requirement; we need to focus on the Markov model of e2eDelay. It can be measured by the concatenation of Edge and Core delays in the downlink eMBB service from a remote source to a mobile user. Here, Edge delay is directly affected by the Core network via a decreased packet delivery ratio to Edge under huge-traffic intensity background. Therefore, Target eNodeB decision by considering only Edge network can be misleading. To overcome this, we jointly consider Edge and Core delays which are differently affected by each handover states: (1) preparation, (2) execution, and (3) completion. The joint consideration of Edge and Core can be only handled with a novel cost-effective SDUN framework by dynamically removing state (2). It triggers handover via network-centric monitoring; and then, it predetermines optimal TeNB with a proposed optimization formula and shortest Core path according to traffic intensities of OpenFlow switches. Here; SDUN controller is cost-efficient by the proposed parallel runnable algorithms: Parallel Edge Delay Optimization and Parallel Shortest Delay Path. In the performance evaluation; SDUN is firstly emulated for a specific eMBB traffic, i.e. QUIC based HTTP/3 Video content traffic with 1080p resolution, and secondly simulated in system-level on Matlab. It meets 5G requirements as follows: SDUN decreases Core delay 7.16 milliseconds per a UE under huge-traffic intensity and keeps Edge delay under 5G requirement with 20\% more delivery ratio than the conventional one. Moreover, the cost of SDUN controller is analyzed as O(k\textsuperscript{4}log\textsuperscript{2}(k)) and the cost efficiency is observed as the 50\% increased scalability level with the acceptable 8\% extra virtual memory usage. In Handover Management for URLLC services; we believe that the handover is executed with network service chain by vEPC thanks to Network Function Virtualization (NFV) to handle end to end mobility and to reduce the OPEX/CAPEX costs of vehicular networks. However; as the number of handover requests for the leader in platoon has increased in an ultra-dense topology with a high number of roadside units (RSUs), the SDUN/NFV controller has become a bottleneck with an increased response time to a vehicle. In this thesis, we investigate the following research question: How to reach few milliseconds e2eDelay for URLLC services in 5G vehicular networks? Therefore, we propose a new SDUN/NFV based handover management without disrupting the centralized manner of SDUN controller. To do this, we define a logical and physical coverage area of RSUs with two newly redesigned VNFs named as Small cell and Macrocell virtual Network Functions (SvNF, MvNF). The former one is for serving vehicle on RSU as a small cell via physical coverage; whereas the latter one is for forwarding data packets over the same RSU that is a macrocell via logical coverage without any handover request. E2eDelay is monitored by the proposed queuing theoretic formula in a novel Handover Triggering Algorithm which checks the length of service chain and determines the optimal time to run handover network function. According to performance results, the proposed SDUN/NFV architecture offers 12 milliseconds reduced e2eDelay, by keeping it under 5G requirements (a few milliseconds) with a service chain up to 7 lengths and keeping the centralized manner of SDN.