베어메탈 솔루션 네트워크 성능 문제 체크리스트
이 페이지에서는 네트워크 성능 문제 해결에 대한 체크리스트를 제공합니다. 아래 플로차트는 이러한 문제를 해결하는 동안 따라야 하는 경로를 보여줍니다.
속도 테스트 수행(처리 테스트)
점프 호스트와 베어메탈 솔루션 서버 사이에 대역폭 문제가 있는 경우 Compute Engine VM 또는 애플리케이션 서버와 베어메탈 솔루션 서버 간에 속도 테스트를 수행합니다.
리전 간 테스트로 인해 처리량이 낮아지고 예상한 처리량 값이 표시되지 않을 수 있으므로 소스 서버가 베어메탈 솔루션 서버와 동일한 리전에 상주해야 합니다.
또 다른 중요한 사항은 소스 머신의 머신 유형과 Compute Engine 머신 유형에 설명된 대로 각 머신 유형이 제공하는 최대 이그레스 대역폭(Gbps)입니다.
단일 TCP 스트림으로 iperf3
를 실행하면 대역폭 제한이 발생하므로 iperf3
도구는 항상 여러 개의 동시 스트림으로 실행되어야 합니다.
베어메탈 솔루션 서버에 로그인하고 iperf3
서버를 실행하여 클라이언트의 TCP 연결을 수락합니다.
iperf3 -s 192.168.1.10
-----------------------------------------------------------
Server listening on 5201
-----------------------------------------------------------
Compute Engine VM에서 iperf3을 실행한 상태로 서버 연결을 열어 처리량을 테스트합니다.
iperf3 -c 192.168.1.10 -P 128
Connecting to host 192.168.1.10, port 5201
[SUM] 0.00-10.00 sec 10.3 GBytes 8.85 Gbits/sec 150161 sender
[SUM] 0.00-10.00 sec 10.3 GBytes 8.82 Gbits/sec receiver
원하는 속도/대역폭이 확보되지 않으면 문제가 다음 시나리오 중 하나에 해당하는지 확인합니다.
시나리오 1: 점프 호스트는 최대 이그레스 대역폭 제한이 있는 작은 VM입니다.
모든 서버 유형의 최대 이그레스 대역폭 한도는 Compute Engine 머신 유형 페이지에서 확인할 수 있습니다.
Partner Interconnect가 5Gbps인 베어메탈 솔루션 서버와 동일한 리전에서 Compute Engine VM(예: n1-standard-1
)을 사용하는 경우 다음과 같이 표시됩니다.
iperf3 -c 192.168.1.10 -P 128
Connecting to host 192.168.1.10, port 5201
[SUM] 0.00-10.00 sec 2.31 GBytes 1.98 Gbits/sec 129 sender
[SUM] 0.00-10.00 sec 2.24 GBytes 1.93 Gbits/sec receiver
그 결과 각각 5Gbps 속도의 상호 연결이 2개 있더라도 원하는 성능을 얻을 수 없습니다. 이는 n1-standard-1
머신에서 지원하는 최대 이그레스 대역폭이 2Gbps이기 때문입니다.
해결책: 원하는 결과를 얻기 위해 더 큰 VM으로 이동합니다.
시나리오 2: 점프 호스트는 베어메탈 솔루션 서버와 다른 리전에 있습니다.
리전 간 서버 간에 속도 테스트를 수행하는 경우 리전 간 지연 시간의 증가로 인해 원하는 결과를 얻을 수 없습니다.
다음은 us-central1
의 Compute Engine VM과 southamerica-east1
의 베어메탈 솔루션 서버 간의 속도 테스트를 보여줍니다.
iperf3 -c 192.168.1.10 -P 128
Connecting to host 192.168.1.10, port 5201
[SUM] 0.00-10.00 sec 3.12 GBytes 2.68 Gbits/sec 15569 sender
[SUM] 0.00-10.00 sec 3.02 GBytes 2.60 Gbits/sec receiver
리전 간 연결 시 대역폭/속도가 크게 저하됩니다.
해결책: 동일한 리전에서 베어메탈 솔루션 서버에 연결합니다.
시나리오 3: iperf3가 여러 개의 동시 스트림으로 실행됩니다.
다음은 단일 TCP 스트림으로 iperf3
를 실행한 결과를 보여줍니다.
iperf3 -c 192.168.1.10
Connecting to host 192.168.1.10, port 5201
[ 5] local 10.158.0.6 port 40382 connected to 192.168.1.10 port 5201
[ ID] Interval Transfer Bitrate Retr Cwnd
[ 5] 0.00-1.00 sec 325 MBytes 2.72 Gbits/sec 162 1.72 MBytes
[ 5] 1.00-2.00 sec 345 MBytes 2.89 Gbits/sec 42 1.36 MBytes
[ 5] 2.00-3.00 sec 345 MBytes 2.89 Gbits/sec 0 1.53 MBytes
[ 5] 3.00-4.00 sec 344 MBytes 2.88 Gbits/sec 0 1.68 MBytes
[ 5] 4.00-5.00 sec 345 MBytes 2.89 Gbits/sec 67 1.32 MBytes
[ 5] 5.00-6.00 sec 345 MBytes 2.89 Gbits/sec 0 1.49 MBytes
[ 5] 6.00-7.00 sec 345 MBytes 2.89 Gbits/sec 0 1.65 MBytes
[ 5] 7.00-8.00 sec 344 MBytes 2.88 Gbits/sec 0 1.79 MBytes
[ 5] 8.00-9.00 sec 321 MBytes 2.69 Gbits/sec 64 1.39 MBytes
[ 5] 9.00-10.00 sec 324 MBytes 2.72 Gbits/sec 91 1.13 MBytes
- - - - - - - - - - - - - - - - - - - - - - - - -
[ ID] Interval Transfer Bitrate Retr
[ 5] 0.00-10.00 sec 3.30 GBytes 2.84 Gbits/sec 426 sender
[ 5] 0.00-10.00 sec 3.30 GBytes 2.83 Gbits/sec receiver
동일한 서버에서 iperf3
를 실행하지만 여러 TCP 스트림을 사용하면 원하는 성능을 얻을 수 있습니다.
iperf3 -c 192.168.1.10 -P 128
Connecting to host 192.168.1.10, port 5201
[SUM] 0.00-10.00 sec 10.3 GBytes 8.85 Gbits/sec 150161 sender
[SUM] 0.00-10.00 sec 10.3 GBytes 8.82 Gbits/sec receiver
해결책: iperf3
와 함께 여러 개의 동시 스트림을 사용합니다.
2단계: 네트워크 지연 시간 측정
동일한 리전 내에서 연결하면 평균 왕복 지연 시간이 2ms 미만일 것으로 예상됩니다.
ping
을 사용하여 서버 간 지연 시간을 확인합니다. mtr
을 사용하여 평균 지연 시간을 가져올 수도 있습니다.
ping 192.168.1.10
PING 192.168.1.10 (192.168.1.10) 56(84) bytes of data.
64 bytes from 192.168.1.10: icmp_seq=1 ttl=88 time=1.78 ms
64 bytes from 192.168.1.10: icmp_seq=2 ttl=88 time=0.507 ms
64 bytes from 192.168.1.10: icmp_seq=3 ttl=88 time=0.659 ms
64 bytes from 192.168.1.10: icmp_seq=4 ttl=88 time=0.735 ms
64 bytes from 192.168.1.10: icmp_seq=5 ttl=88 time=0.592 ms
64 bytes from 192.168.1.10: icmp_seq=6 ttl=88 time=0.550 ms
64 bytes from 192.168.1.10: icmp_seq=7 ttl=88 time=0.552 ms
64 bytes from 192.168.1.10: icmp_seq=8 ttl=88 time=0.588 ms
64 bytes from 192.168.1.10: icmp_seq=9 ttl=88 time=0.614 ms
^C
--- 192.168.1.10 ping statistics ---
9 packets transmitted, 9 received, 0% packet loss, time 169ms
rtt min/avg/max/mdev = 0.507/0.730/1.781/0.378 ms
최소, 평균, 최대 지연 시간은 2ms 이내이며, 이는 Google Cloud 리전 및 리전 확장 간의 예상 지연 시간입니다.
또는 MTR
을 사용하여 지연 시간을 동적으로 측정할 수도 있습니다.
mtr --curses 192.168.1.10
test-arka (10.158.0.6) 2020-12-11T08:08:51+0000
Keys: Help Display mode Restart statistics Order of fields quit
Packets Pings
host Loss% Snt Last Avg Best Wrst StDev
1. ???
2. 192.168.1.10 0.0% 16 0.7 0.7 0.6 1.5 0.2
또한 mtr
을 사용하면 원하는 네트워크 성능도 볼 수 있습니다.
평균 지연 시간이 2ms를 초과한다면 연결이 동일한 리전 내에서 이루어지는지 확인합니다. 리전 간 지연 시간 테스트를 수행하면 다음과 같이 지연 시간이 추가로 발생합니다.
ping 192.168.1.10
PING 192.168.1.10 (192.168.1.10) 56(84) bytes of data.
64 bytes from 192.168.1.10: icmp_seq=1 ttl=59 time=144 ms
64 bytes from 192.168.1.10: icmp_seq=2 ttl=59 time=142 ms
64 bytes from 192.168.1.10: icmp_seq=3 ttl=59 time=142 ms
64 bytes from 192.168.1.10: icmp_seq=4 ttl=59 time=142 ms
64 bytes from 192.168.1.10: icmp_seq=5 ttl=59 time=142 ms
64 bytes from 192.168.1.10: icmp_seq=6 ttl=59 time=142 ms
^C
--- 192.168.1.10 ping statistics ---
6 packets transmitted, 6 received, 0% packet loss, time 5003ms
rtt min/avg/max/mdev = 142.004/142.390/144.079/0.845 ms
해결책: 동일한 리전 내에서 연결합니다.
3단계: 홉 수 확인
앞의 테스트에서 불일치가 발생하면 점프 호스트와 베어메탈 솔루션 호스트 사이의 홉 수가 있는지 확인합니다. 불필요한 홉이 있으면 네트워크 성능이 저하될 수 있습니다.
traceroute 192.168.1.10
traceroute to 192.168.1.10 (192.168.1.10), 30 hops max, 60 byte packets
1 * * *
2 169.254.215.122 (169.254.215.122) 2.713 ms * 1.757 ms
3 192.168.1.10 (192.168.1.10) 2.656 ms 2.595 ms *
traceroute 192.168.1.10
traceroute to 192.168.1.10 (192.168.1.10), 30 hops max, 60 byte packets
1 * * *
2 192.168.1.10 (192.168.1.10) 2.323 ms 2.260 ms 2.353 ms
베어메탈 솔루션 서버와 동일한 리전에 있는 Compute Engine 인스턴스 간에 테스트를 수행하는 경우 홉이 표시되지 않거나 호스트 측 데이터 센터 라우터에 대한 홉이 최대 1개 표시됩니다.
위의 예시에서 IP 169.254.215.122
는 호스트 측 데이터 센터 IP입니다.
Console의 하이브리드 연결 -> 상호 연결 페이지에서 이와 같은 주소를 확인할 수 있습니다.
IP 범위 169.254.0.0
에 홉이 있는 경우 Google Cloud 내부 Cloud Router IP이므로 걱정할 필요가 없습니다. 이 외에 다른 홉이 있다면 추가 홉을 상세히 조사해야 할 수 있으며 추가 홉이 사용된 위치와 방법에 대한 지원도 요청해야 할 수 있습니다.