Scalable VM and Container Networking using /32bit subnets and BGP - PowerPoint PPT Presentation

L.T.H. Scalable VM and Container Networking using /32bit subnets and BGP routing Andrew Yongjoon Kong

2 nd largest search and portal

The Peaceful operation When we’re running out of resources ( cpu, memory, disk ), Just add new( or additional ) resources to existing one. Central monitoring NSDB tree System Network team team CMDB API New servers provisioned server nkaos New servers (baremetal provisioned servers provisioner) New servers provisioned servers switches, router, vlans New servers provisioned servers Our Chef server Team

The Growth(I) VM creation speed is accelerating

The Growth(II) Spend more than 45M krane ( $45,000) per month – this also increased. 1 krane = 1 Won ( $0.001) • Using similar pricing with AWS EC2 • Network/Disk usage not included

The Growth(III) Growth is accelerating - No. of Engineer is growing - New Pilot services or experiments are growing. The resources depletion speed is accelerating à this simply make more work to resource - management teams Central NSDB monitoring tree System Network team team CMDB API New servers New servers New servers New servers New servers New servers New servers Baremetal Provisioner New servers New servers New servers New servers New servers New servers New servers New servers Our New servers Chef server Team

The Growth(IV) Scale, The only driving force disrupt everything. Central NSDB monitoring tree System Network team team CMDB API Our Baremetal Provisioner Team New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers Chef server New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers Chef New servers server New servers Chef server

The Growth – Lesson learned Growth doesn’t come alone – Infra growth includes scale-up , scale-out as well New servers – Scale-up includes these New servers New servers New servers New servers New servers New servers New servers • Add Server, Storage, Switches New servers New servers New servers New servers New servers • Add more power facility to supply juice fluently New servers New servers New servers Chef server • This is not that difficult. – Scale-out include these • Add New Datacenters, New Availability Zones New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers • New servers New servers This is nightmare! New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers This leads radical changes over everything New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers – The way of preparing, provisioning New servers New servers New servers New servers New servers New servers New servers New servers Chef server Chef server New servers New servers New servers New servers New servers New servers New servers New servers New servers New servers Chef server Chef server New servers New servers New servers New servers – The way of monitoring, logging, developing Chef server Chef server

Some Numbers 1021 tenants 662 pull request since 2014.9 136 VMs are created/deleted per day

Some information about kakao Openstack openstack upgraded from grizzly to Liberty total 4Region additional service Heat/Trove/Sahara/ Octavia

The Growth – Lesson learned, Openstack (2) Resources for Openstack finally comes to be exhausted – CPU, Memory, Storage always experience shortages. – They have skewness. – Sometimes, CPU depleted. Sometimes, Storage depleted. • All resources are able to be re-balanced. • you can migration clients’ VM ( image , volume ) – IP is also Resources. • Very limited than our expectations – No of IP counts is limited. – Location of IP also is limited. • Managing these Resources is getting tougher issue.

OpenStack Neutron Network We’ve been using Provider Network (VLAN) – ML2 plugin – From OVS à LinuxBridge. – Network Team plan/setup networks (the VLAN, IP[subnet], Gateways) – Mapping availability zone / Neutron Network to that Physical networks VLAN.3 VLAN.2 VLAN.1 Hypervisor eth0 Zone2 Zone3 K Zone1 V (a.k.a (a.k.a (a.k.a M eth0 tapxxx Rack) Rack) Rack) brqxxx vm eth1.1 eth1

Resource Imbalance After Running multiple Available Zones – Experiencing resource imbalance between zones, naturally – Filter Scheduling won’t helpful. – Migration is a proper solution. ( add extra resource is better If possible ) openstack scheduler VLAN.2 VLAN.3 VLAN.1 x Zone2 Zone3 Zone1 No CPU 1 CPU 1 storage No No IP Storage Hey Openstack, Left 1 IP Create 1 VM ( 1cpu, 1 IP, 1 Storage)

Resource Imbalance & Remedies Develop Network Count filter – Check Remaining IP count for each zone, treat ip count as resource – Select the zone which have more ip count – but experiencing harder issue • Setup more 2Vlan ( and also trunking ) on same ethernet • leading heterogeneous policy which cause complex configurations • Still, Migration VM through zones with ip unchanged is not possible. VLAN.1 VLAN.10 Hypervisor eth0 VLAN trunk eth0 vm1 K brqYYY V eth1.10 Zone1 M eth0 eth1 tapxxx vm1 eth1.1 brqxxx

Rationale Rethinking about Connectivity client destination Application Application same subnet TCP TCP different broadcast subnet domain2 IPv4 IPv4 ARP Table ARP Table dest IP mac eth0 SRC IP mac eth0 Router mac eth0 Router mac eth0 ethernet ethernet IP IP driver driver broadcast domain broadcast termination A.K.A Router

Rationale Rethinking about Connectivity (Overlay) – it solve remote link layer separation issue. – Still have issue with IP management. and Gateway ( Packet Forwarding) Application Application TCP TCP IPv4 IPv4 ARP Table ARP Table dest IP mac eth0 SRC IP mac eth0 Router mac eth0 Router mac eth0 ethernet ethernet IP IP driver driver broadcast domain broadcast domain tun tun nel nel

Remedy , Version 2.0 we need to thinks of those requirement – IP movement inter-rack, inter-zone, inter-dc(?) – IP resource imbalance – Fault Resilience – Dynamically check status of network – Simple IP Resource Planning and Management

Router We thinks Router as best candidate – It dynamically detects and exchanges changes. (via dynamic routring protocol) – It is highly distributed. – It have HA ( e.g. VRRP) – the issue is that most of time routing is done in ranges (a.k.a Subnet) • Because of Memory and CPU issue

Finally, Come to route only IP Generally, Known as /32 network. 10.0.0.1 / 32 or IP 10.0.0.1 netmask 255.255.255.255 – No L2 (link) consideration needed anymore ( no subnet ) – With Dynamic Routing Protocol, it move every where. – Simple IP planning ( Just think of IP ranges ) – It’s very Atomic Resource, it keeps its IP after migration through zones

How it setup 1. install nova/neutron agent. 2. create neutron network ( name: freenet, subnet: 10.10.100.0/24) Compute node 10.10.100.1 eth1 dhcp-server process neutron-dhcp-agent neutron- linuxbridge-agent nova-compute eth0

How it setup 1. install nova/neutron agent. 2. create neutron network ( name: freenet, subnet: 10.10.100.0/24) 3. user create VM Compute node dhcp-server process eth1 IP:10.10.100.2/32 10.10.100.1 GW: 10.10.100.1 neutron-dhcp-agent linux bridge neutron- linuxbridge-agent vm Controller nova-compute eth0

How it works 1. install nova/neutron agent. 2. create neutron network ( name: freenet, subnet: 10.10.100.0/24) 3. user create VM Routing Table 4. update Routing(with Dynamic routing protocol) 1 10.100.10.2/32 via 192.1.1.201 192.1.1.202 Compute node Routing Table Default GW 192.168.1.1 eth1 192.1.1.201 dhcp-server advertising: Host Route dest 10.10.100.2/32 process to 10.10.100.1 eth1 via Dynamic Routing Protocol 10.10.100.1 neutron-dhcp-agent linux bridge IP:10.10.100.2/32 neutron- GW: 10.10.100.1 linuxbridge-agent vm Controller nova-compute eth0

Scalable VM and Container Networking using /32bit subnets and BGP - PowerPoint PPT Presentation

L.T.H. Scalable VM and Container Networking using /32bit subnets and BGP routing Andrew Yongjoon Kong 2 nd largest search and portal The Peaceful operation When were running out of resources ( cpu, memory, disk ), Just add new( or

DISASTER RELIEF CENTER 2x Accommodation Container 2x Sanitary Container 1x

Container Library and FUSE Container File System Softwarepraktikum f ur Fortgeschrittene

Postcapitalism Jamie Dobson, GOTO Berlin, 2016 www.container-solutions.com |

Kubernetes Crossing the Chasm 05.03.2018 Ian Crosby @IanDCrosby info@container-solutions.com

Mini-Bulk/IBC Pesticide Container Collection Program EPA Sponsored California San Joaquin Valley

Container Live Migration Adrian Reber FOSDEM 2020, February 01 Red Hat Blog: Container

Simplify Container Networking With iCAN Huawei Cloud Network Lab Container Network Defined By

Cache Coherence in Scalable Machines Scalable Cache Coherent Systems Scalable, distributed

Torrent-based software distribution Costin Grigoras Pablo Saiz ALICE Offline Week 24.06.2009

to of Microcontrollers ECE Senior Design 9 February 2017 Popular Microcontrollers 8051

Networking in Eastern Networking in Eastern Networking in Eastern Networking in Eastern Europe

Optimization Models for Container Inspection Endre Boros RUTCOR, Rutgers University Joint work

A Series Of Unfortunate Container Events Netflixs container platform lessons learned About the

Welcome to EUROGATE Container Terminal Limassol Ltd. AGENDA 1. Introduction: EUROGATE Container

Lessons Learnt from Running a Container Native Cloud Xu Wang (@gnawux) CTO & Cofounder,

Investor / Analyst Presentation Q1FY 2011 Nhava Sheva Intl Container Terminal (NSICT) Nhava

CS 356: Computer Network Architectures Lecture 13: Border Gateway Protocol and switching

DIGITAL ADVERTISING AN INTRODUCTION EQUINET ACADEMY G1 2 ARE YOU PREPARED FOR CHANGE ? Who

News and Media Literacy: Building Critical Consumers and Creators Jeff Mao @jmao121

Introduction Recommender Systems What is this lecture about? What is the purpose of a

IPv6 Deployment at Monash University John Mann Agenda IPv6 is Coming IPv6 is Already

Border Gateway Protocol: The Good, Bad, and Ugly of Internet Routing Jim Cowie, Chief Scientist

Network Data Plane Network Data Plane Network Data Plane (S. S. Lam) 3/23/2017 1 Network layer

Weak State Routing for Large Scale Dynamic Networks Utku Gnay Acer, Shivkumar Kalyanaraman,

Sambuz

Useful Links

Newsletter

Mail Us

Scalable VM and Container Networking using /32bit subnets and BGP - PowerPoint PPT Presentation

L.T.H. Scalable VM and Container Networking using /32bit subnets and BGP routing Andrew Yongjoon Kong 2 nd largest search and portal The Peaceful operation When were running out of resources ( cpu, memory, disk ), Just add new( or

DISASTER RELIEF CENTER 2x Accommodation Container 2x Sanitary Container 1x

Container Library and FUSE Container File System Softwarepraktikum f ur Fortgeschrittene

Postcapitalism Jamie Dobson, GOTO Berlin, 2016 www.container-solutions.com |

Kubernetes Crossing the Chasm 05.03.2018 Ian Crosby @IanDCrosby info@container-solutions.com

Mini-Bulk/IBC Pesticide Container Collection Program EPA Sponsored California San Joaquin Valley

Container Live Migration Adrian Reber FOSDEM 2020, February 01 Red Hat Blog: Container

Simplify Container Networking With iCAN Huawei Cloud Network Lab Container Network Defined By

Cache Coherence in Scalable Machines Scalable Cache Coherent Systems Scalable, distributed

Torrent-based software distribution Costin Grigoras Pablo Saiz ALICE Offline Week 24.06.2009

to of Microcontrollers ECE Senior Design 9 February 2017 Popular Microcontrollers 8051

Networking in Eastern Networking in Eastern Networking in Eastern Networking in Eastern Europe

Optimization Models for Container Inspection Endre Boros RUTCOR, Rutgers University Joint work

A Series Of Unfortunate Container Events Netflixs container platform lessons learned About the

Welcome to EUROGATE Container Terminal Limassol Ltd. AGENDA 1. Introduction: EUROGATE Container

Lessons Learnt from Running a Container Native Cloud Xu Wang (@gnawux) CTO &amp; Cofounder,

Investor / Analyst Presentation Q1FY 2011 Nhava Sheva Intl Container Terminal (NSICT) Nhava

CS 356: Computer Network Architectures Lecture 13: Border Gateway Protocol and switching

DIGITAL ADVERTISING AN INTRODUCTION EQUINET ACADEMY G1 2 ARE YOU PREPARED FOR CHANGE ? Who

News and Media Literacy: Building Critical Consumers and Creators Jeff Mao @jmao121

Introduction Recommender Systems What is this lecture about? What is the purpose of a

IPv6 Deployment at Monash University John Mann Agenda IPv6 is Coming IPv6 is Already

Border Gateway Protocol: The Good, Bad, and Ugly of Internet Routing Jim Cowie, Chief Scientist

Network Data Plane Network Data Plane Network Data Plane (S. S. Lam) 3/23/2017 1 Network layer

Weak State Routing for Large Scale Dynamic Networks Utku Gnay Acer, Shivkumar Kalyanaraman,

Sambuz

Useful Links

Newsletter

Mail Us

Lessons Learnt from Running a Container Native Cloud Xu Wang (@gnawux) CTO & Cofounder,