frieren #오디오 생성 #audio generation # generative ai # flow matching # rfm 썸네일형 리스트형 FRIEREN: Efficient Video-to-Audio Generation Network with Rectified Flow Matching Flow Matching 이란?Rectified Flow Matching(RFM)의 기본 원리노이즈 분포에서 데이터 분포로의 전송 경로를 학습하는 모델 • 노이즈 분포: 무작위 샘플(p_0(x)), 예를 들어 랜덤 숫자. • 데이터 분포: 우리가 원하는 결과(p_1(x)), 예를 들어 오디오의 멜스펙트로그램.Probability path를 정의하고 이를 기반으로 샘플을 변환함Probability path: 노이즈 샘플( $x_0$)에서 데이터 분포( $x_0$)으로 이동하는 경로RFM은 이 경로를 직선에 가깝게 설계합니다.경로 학습 • x_0: 노이즈 분포에서 샘플링된 초기 값. • x_1: 데이터 분포에서 샘플링된 목표 값. • x(t): 시간 t에 따라 x_0에서 x_1로 이.. 더보기 이전 1 다음