Skip to content

2024

Data assimilation - filtering

All models are wrong, but some are useful.

어떤 자연 현상의 시간에 대한 변화를 다음과 같은 미분방정식으로 표현했다고 하자.

\[ \frac{du}{dt} = F(u). \]

미분방정식을 유도할 때는, 일반적으로 아주 작은 스케일의 움직임까지 기술하기란 어려운 법이므로, 적당히 평균을 내기 마련이다. 이 과정에서 실제 현상과 모델 사이 오차가 생기게 되고, 시간이 지남에 따라 모델이 예측하는 현상과 실제 현상의 차이는 점점 커진다.

아래 동영상의 왼쪽 패널을 보면, 초기에 생긴 오차가 빠르게 퍼져 시뮬레이션이 잘 되지 않는 것을 볼 수 있다. 반면, 관측자료는 관측 오차가 있을지언정 실제 현상에 대한 정보를 담고 있다. 아래 동영상의 가운데 패널에 오차가 낀 관측자료가 나타내어져 있다.

자료동화에서 filtering이란, 실제 상태의 추정치 \(u_f\)가 있을 때 관측자료 \(y\)에 기반해 추정치를 업데이트 하는 방법이다. 즉, 위 동영상에서 첫번째 패널과 두번째 패널을 합쳐 세번째 패널을 만드는 과정이다.

Python array

지난 10월 7일에 배포된 Python 3.13 업데이트를 보다가, 파이썬에도 array 모듈이 있다는 것을 발견했다. Numpy에만 있는 줄 알았다.

배열 자료형은 list와 비슷하지만 요소들의 type이 모두 똑같다는 특징이 있는데, 이 덕분에 평소에 자주 사용하던 routine의 속도를 향상시킬 수 있지 않을까 싶어서 간단한 실험을 해봤다.

Review: KARINA

KIST에서 KARINA1라는 pure deep learning based climate forecast 모델을 개발했다고 한다.

KARINA

KIST's Atmospheric Rhythm with Integrated Nerual Algorithm의 약자이다.

기존 모델들에 비하여 성능이 떨어지지 않으며 training time을 줄여 efficiency를 확보했다고 한다.

Summary

내가 이해하기로는 두 가지 방법을 제안한 것 같다.

  1. Geocyclic Padding
  2. SENet

Review: Neural general circulation models

Machine Learning accelerated global weather prediction model developed by Google. Written in JAX framework 12 Two advantages over pure ML methods:

  • Uncertainty estimates
  • Long time simulation

24년 7월 22일 (내 28번째 생일), Nature에 “Neural general circulation models for weather and climate” 이라는 제목의 논문이 올라왔다. “Neural” 키워드를 보고 “data 때려 맞추는 모델 아니야?” 라고 생각할 수 있겠지만, 그렇지 않다.