연구 과제

Cloud Continuum

클라우드 컨티뉴엄 병렬 학습 및 인프라지원 기술

과제 1

  • 허의남 교수

클라우드 컨티뉴엄 인프라 구축

  • 클라우드 컨티뉴엄 환경에서의 DPU 활용 거대AI 지원 동적 네트워크(SDN) 구성 기술
  • 클라우드 컨티뉴엄 환경에서 실시간 고효율 브로커 기술

클라우드 컨티뉴엄 기반 학습 파라미터 파티셔닝

  • SDN 기반 인프라 구축 및 DPU를 통한 파라미터 공유 기술
  • 클라우드 컨티뉴엄 Self-Healing 기술
  • 학습 가속화를 위한 이기종 GPU 클러스터에서 Atomic Level 하이브리드 동결 기술

클라우드 컨티뉴엄 대규모 병렬학습 구조

  • 클라우드 컨티뉴엄을 횡단하는 컨티뉴엄 오버레이 뉴럴 네트워크 구축 기술

클라우드 컨티뉴엄 기반 병렬 학습 지원 아키텍처

클라우드 컨티뉴엄 Self-Healing 기술

컨티뉴엄 오버레이 뉴럴 네트워크

저전력 고효율 컴퓨팅 미래 서비스

과제 2

  • 서의성 교수

거대모델을 위한 학습 클러스터 모니터링 및 탄력적 스케일링 도구

  • 거대모델 분산학습 클러스터 모니터링 및 Resource 사용패턴 분석 가능한 통합 관제 시스템
  • 분산학습 클러스터의 자원 사용 효율성을 높이기 위한 동적 스케일링 제어 기술

GPU 운영 효율을 높일 수 있는 대규모 학습 클러스터의 탄력적 스케줄링

  • 대규모 분산학습 클러스터의 에너지 효율성/학습성능 향상 가능한 탄력적 스케줄링 알고리즘
  • 전체적인 학습 클러스터의 자원 활용률을 향상시키기 위한 거대모델의 학습과 추론 작업의 Co-Location 지원 기술

클라우드 컨티뉴엄 기반 데이터 통신 기술 개념도

클라우드 컨티뉴엄 기반 데이터 통신 기술 개념도

개인정보처리방침

Close

이메일무단수집거부

닫기