Infrastructure · Cloud · DevOps Engineer · 21년+

인프라는 안정효율
증명되어야 합니다.

양승광 (Seungkwang Yang) · 클라우드/DevOps 시스템 엔지니어 · 現 인프라 실장

온프레미스부터 멀티 클라우드, Kubernetes, IaC, 데이터·AI 인프라까지 — 게임 서비스 운영 15년의 경험을 바탕으로 장애를 예방하는 아키텍처측정 가능한 비용 절감을 만들어 왔습니다.

About
소개

클라우드 및 DevOps 분야에서 21년 이상 경험을 쌓은 시스템 엔지니어입니다. AWS, Kubernetes, Terraform, Ansible, Jenkins 등을 활용한 인프라 구축·운영에 전문성을 보유하고 있으며, MSA·컨테이너 기반의 클라우드 네이티브 환경 설계에 강점이 있습니다. 최근에는 데이터 수집 파이프라인과 AI 워크로드를 위한 인프라 구축·운영을 담당하며, Airflow 기반 데이터 파이프라인과 Snowflake 운영, 클라우드 비용 최적화를 주도했습니다. 게임 서비스 운영과 보안 관리(EDR·DDoS·ISO27001/SOX ITGC) 경험을 바탕으로 안정적이고 효율적인 아키텍처를 설계하며, AI·자동화 도구를 업무에 적극 활용해 운영 효율을 높이는 데에도 역량을 갖추고 있습니다. 특정 클라우드에 종속되지 않는(Lock-in free) 유연한 인프라를 지향하며, SRE·DevSecOps·Chaos Engineering으로 영역을 확장하고 있습니다.

Impact
대표 성과

"왜 해결해야 했고, 어떤 결과를 냈는가" — 숫자로 증명한 핵심 성과입니다.

0%↓
AWS 월 운영비용 절감
500~600만원 → 300~400만원
0%↓
Snowflake 일 비용 절감
$50~60 → $20~30 / day
0
정부사업 PM 연 매출 기여
한국농수산식품유통공사
0년+
인프라/시스템 엔지니어 경력
2004 ~ 現
Projects
주요 프로젝트

각 프로젝트를 문제 → 전략 → 정량적 성과 흐름으로 정리하고, 프로젝트별 기여도를 함께 표기했습니다.

데이터 수집 · 파이프라인 인프라 구축 & 클라우드 비용 최적화

포스페이스랩 · 2022.11 ~ 現 · 푸드테크 데이터 플랫폼
기여도 95%
아키텍처 설계·구축·운영 주도
AWS ECS FargateGitHub ActionsTerraformApache AirflowSnowflakeTableau
문제 / 배경
배달앱·POS·물류 등 수천 개 계정의 데이터를 지연·병목 없이 수집해야 했고, 스타트업 특성상 인력이 부족해 운영 부담이 적은 SaaS형 인프라가 필요했습니다. 동시에 빠르게 증가하는 클라우드 비용 통제가 시급했습니다.
전략 / 접근
수집 워크로드를 컨테이너 기반 AWS ECS로 설계해 계정 증가에도 병목이 없도록 구성하고, GitHub Actions + Terraform(IaC)으로 배포를 자동화했습니다. 수집 데이터는 Airflow 파이프라인 → Snowflake 가공 → Tableau로 연결해 고객 맞춤 BI를 제공했습니다. 비용은 ECS Fargate Spot 전환과 Snowflake 웨어하우스 운영 최적화로 절감했습니다.
정량적 성과
  • AWS 월 운영비용 약 40% 절감 (500~600만원 → 300~400만원)
  • Snowflake 일 비용 약 50% 절감 ($50~60 → $20~30)
  • 수천 개 계정 데이터 무중단·무지연 수집 인프라 안정화
  • 정부사업(aT) PM 수행으로 연 6천만원 매출 기여

대규모 Linux 서버 자동화 — Configuration Management 도입

네오플 · 던전앤파이터(DNF) 인프라 · 2016 ~
기여도 90%
기술 선정·구축·CERT 협의 주도
AnsibleJenkinsGit / SVNAnsible-Vault2FA VPN
문제 / 배경
다수의 리눅스 서버를 수작업으로 관리하며 OS 튜닝·하드닝·취약점 점검·배포 등 반복 업무의 관리 포인트가 과도했습니다. 자동화가 필요했지만 중앙 SSH 접근 구조는 보안 사고 위험이 커 CERT 설득이 관건이었습니다.
전략 / 접근
Puppet·Chef·Ansible을 비교해 에이전트리스(SSH 기반) Ansible을 선택, 상용 Tower 대신 Jenkins를 결합해 로그·파이프라인·API 연동을 확보했습니다. 보안은 전용 접근 PC, 2차 인증 VPN, audit 정책, Ansible-Vault 암호화로 접근 경로를 최소화·다중화. Jenkins CVE에 월 단위 정기 업그레이드 + 테스트 서버 선검증 체계를 운영했습니다.
정량적 성과
  • OS 튜닝·하드닝·취약점 점검·배포 등 반복 운영 업무 자동화로 관리 포인트 대폭 축소
  • JIRA 연동 기반 운영 자동화 + stage/live 파이프라인 배포 체계 정착
  • 보안팀(CERT) 협의를 통한 무사고 자동화 인프라 운영

사내 Kubernetes HA 클러스터 구축 & 운영

네오플 · 사내 인프라 플랫폼
기여도 90%
기획·구축·패키지 운영 주도
Kubernetes (Kubeadm/Kubespray HA)HelmNexusGitLabElasticsearch APMOpenEBSPrometheus/Grafana
문제 / 배경
사내 인프라 서비스가 개별적으로 운영되어 배포·버전 관리가 분산돼 있었고, 특정 클라우드에 종속되지 않는(Lock-in free) 자유로운 인프라 기반이 필요했습니다.
전략 / 접근
초기 Kubeadm에서 Ansible 기반 Kubespray로 HA 클러스터로 고도화하고, 사내 서비스를 Helm 패키지로 표준화했습니다. Nexus(Maven/Helm 저장소), GitLab, Elasticsearch APM, OpenEBS 공유 스토리지, CoreDNS Private DNS를 Helm으로 버전 관리하고, nginx-ingress(Web/SSL)·Prometheus/Grafana로 모니터링을 구성했습니다. 기존 컴파일 팜(icecc)도 컨테이너화했습니다.
정량적 성과
  • 사내 인프라 서비스 Helm 패키지화로 배포·버전 관리 표준화
  • APM·모니터링 통합으로 장애 가시성 확보
  • 클라우드 비종속형 인프라 기반 확립 (멀티/하이브리드 확장성)

AWS 클라우드 네이티브 웹/게임 서비스 구성

DNF Universe (dnf-universe.com) · 모바일 게임
기여도 80%
인프라 설계·IaC 구축
Elastic BeanstalkLambda@EdgeCloudFrontRDS/MySQLELB/ALBElasticsearchTerraformtd-agent
문제 / 배경
다양한 브라우저 환경에서의 이미지 호환과 빠른 배포·캐시, 그리고 게임 지표 분석을 위한 안정적 로그 수집이 필요했습니다.
전략 / 접근
웹은 Jenkins+Git 빌드 → Elastic Beanstalk(Java)로 구성하고, Lambda@Edge로 이미지 변환 + CloudFront 배포/캐시를 적용했으며 전 과정을 Terraform IaC로 관리했습니다. 모바일 게임은 RDS·CloudFront·Elasticsearch·EC2·ALB로 구성, 로그는 td-agent로 취합하고 ALB로 수집 에이전트를 이중화해 장애에 대비했습니다.
정량적 성과
  • 멀티 브라우저 이미지 변환·캐시 자동화 (Lambda@Edge + CloudFront)
  • 로그 수집 이중화로 장애 내성 확보, Elasticsearch 기반 게임 지표·BI 활용
  • IaC 전환으로 재현 가능한 운영 환경 구축

RO1 글로벌 온라인게임 클라우드 마이그레이션 (하이브리드)

그라비티 · 글로벌 서비스
기여도 75%
마이그레이션 설계·테스트 환경 구축
AWS하이브리드 클라우드마이그레이션테스트 환경 구성
문제 / 배경
코로나로 해외 출장이 불가능한 상황에서 글로벌 서비스를 운영해야 했고, 서비스 초기 구축에 드는 과도한 온프레미스 인프라 비용이 부담이었습니다.
전략 / 접근
레거시 온프레미스 환경을 AWS로 마이그레이션하되, 라이브 적용 전 테스트 서버 환경을 별도 구성해 검증했습니다. 초기는 클라우드로 비용·접근성을 해결하고, 안정화 후 온프레미스로 재구축하는 하이브리드 전환 로드맵을 설계했습니다.
정량적 성과
  • 출장 제약 하에서 원격 클라우드 전환으로 서비스 연속성 확보
  • 초기 인프라 투자 비용을 클라우드 종량제로 대체
  • 안정화 후 온프레미스 재구축을 고려한 하이브리드 아키텍처 수립

멀티 클라우드 게임 서비스 운영 & 보안 거버넌스

그라비티 · 정보보안 + 게임서비스운영 조직 총괄 · 2020~2022
기여도 100%
2개 조직 그룹장 · 도입 리드
GCP / AWS / TencentCrowdStrike (EDR)Cloudflare (DDoS/WAF)ISO27001SOX ITGC
문제 / 배경
다양한 퍼블리싱·글로벌 게임을 여러 클라우드에서 운영하며 일관된 보안·컴플라이언스 체계가 필요했고, 정보보안과 게임서비스운영 2개 조직을 동시 총괄해야 했습니다.
전략 / 접근
GCP·AWS·Tencent 운영 경험을 토대로 멀티/하이브리드 아키텍처 관점을 정립하고 IaC 기반으로 전환했습니다. CrowdStrike(EDR)·Cloudflare(DDoS/WAF)를 직접 도입하고, ISO27001·SOX ITGC 감사 대응을 리드했습니다.
정량적 성과
  • EDR·DDoS 방어 체계 직접 도입으로 보안 수준 상향
  • ISO27001 / SOX ITGC 감사 대응 리드 (컴플라이언스 확보)
  • 2개 조직 총괄 — 보안과 서비스 운영의 통합 거버넌스 구축
Career
경력
2022.11 ~ 現 (3년 7개월)
포스페이스랩(ForSpaceLab) — 인프라 실장
테크 & 인프라 지원실
데이터 스크래핑/AI 인프라, 클라우드 비용 최적화, 정부사업 PM. 푸드테크 데이터 플랫폼 인프라 전반 설계·운영.
2020.02 ~ 2022.11
(주)그라비티 — 서비스 운영 조직 그룹장
정보보안 + 게임서비스운영 2개 조직 총괄
멀티 클라우드 게임 서비스 운영, EDR·DDoS 도입, ISO27001/SOX ITGC 감사 대응 리드.
2012.04 ~ 2020.02
(주)네오플 — 시스템 엔지니어
던전앤파이터(DNF) 국내/대만/미국 인프라
Ansible+Jenkins 자동화, Kubernetes HA 클러스터·Helm 패키지 운영, Confluence/Jira/Crowd 온프렘 8년 운영.
2005.12 ~ 2012.04
(주)그라비티 — 시스템 어드민
스타이리아 · 뿌까레이싱 · 에밀 크로니클 등
다양한 온라인 게임 서비스 인프라 운영 및 시스템 관리.
2004.05 ~ 2005.12
(주)휴비즈넷 — 전산실 운영
POS / Windows / MSSQL
전산 인프라 운영의 기초를 다진 첫 경력.
Tech Stack
기술 스택

☁ Cloud

AWS (ECS Fargate, EC2, S3, SES, ELB, Lambda@Edge)AzureGCPTencent

⚙ IaC / CI·CD

TerraformAnsibleJenkinsGitHub Actions

📦 Container

Kubernetes (HA)DockerHelmNexusOpenEBS

🛡 Security

CrowdStrike (EDR)Cloudflare (DDoS/WAF)ISO27001SOX ITGC

📊 Monitoring

Prometheus + GrafanaZabbixELK / EFKElasticsearch APM

🗄 Data / AI

Apache AirflowSnowflakeTableauAI 인프라 / 자동화

💾 OS / DB

Linux (CentOS/Ubuntu/FreeBSD)Windows ServerMySQL · MSSQL · PostgreSQLMongoDB · Redis

🧰 Virtualization

VMwareCitrix XenServer

🚀 지향 영역

SREDevSecOpsChaos EngineeringSDN / NFV
자격증  ·  정보처리기사 (2004) · 네트워크관리사 2급 (2003) · KISA 침해사고·DDoS 대응 실무 / 디지털 포렌식 수료 (2010)
학력  ·  한서대학교 컴퓨터정보학과 학사