타임 시리즈 분석 파이썬 라이브러리 목록
tsai
3.2k
https://github.com/timeseriesAI/tsai
tsai는 분류, 회귀, 예측, 대입과 같은 시계열 작업을 위한 최신 기술에 중점을 두고 파이토치 및 패스트아이를 기반으로 구축된 오픈 소스 딥 러닝 패키지입니다.
tsfresh
7.2k
https://github.com/blue-yonder/tsfresh
tsfresh는 파이썬 패키지입니다. 이 패키지는 소위 특징이라고 하는 많은 시계열 특성을 자동으로 계산합니다. 또한 이 패키지에는 회귀 또는 분류 작업에서 이러한 특성의 설명력과 중요성을 평가하는 메서드가 포함되어 있습니다.
darts
https://github.com/unit8co/darts
5.6k
Darts는 시계열에 대한 사용자 친화적인 예측 및 이상 징후 탐지를 위한 Python 라이브러리입니다. 여기에는 ARIMA와 같은 고전적인 모델부터 심층 신경망에 이르기까지 다양한 모델이 포함되어 있습니다. 예측 모델은 모두 같은 방식으로 사용할 수 있으며, fit() 및 predict() 함수를 사용하여 scikit-learn과 유사하게 사용할 수 있습니다. 또한 이 라이브러리를 사용하면 모델을 쉽게 백테스트하고, 여러 모델의 예측을 결합하고, 외부 데이터를 고려할 수 있습니다. Darts는 단변량 및 다변량 시계열과 모델을 모두 지원합니다. ML 기반 모델은 여러 시계열을 포함하는 잠재적으로 큰 데이터 세트에 대해 학습할 수 있으며, 일부 모델은 확률적 예측을 위한 풍부한 지원을 제공합니다. 또한 다트는 광범위한 이상 징후 감지 기능도 제공합니다. 예를 들어, 시계열에 PyOD 모델을 적용하여 이상 징후 점수를 얻거나, Darts 예측 또는 필터링 모델을 래핑하여 완전한 이상 징후 감지 모델을 얻는 것은 간단합니다.
kats
4.3k
https://github.com/facebookresearch/Kats
Kats는 시계열 데이터를 분석하기 위한 툴킷으로, 가볍고 사용하기 쉬우며 일반화할 수 있는 프레임워크로 시계열 분석을 수행할 수 있습니다. 시계열 분석은 주요 통계와 특성을 이해하고, 회귀와 이상 징후를 감지하고, 미래 추세를 예측하는 등 산업계의 데이터 과학 및 엔지니어링 업무에서 필수적인 요소입니다. Kats는 탐지, 예측, 특징 추출/임베딩, 다변량 분석 등을 포함한 시계열 분석을 위한 원스톱 쇼핑을 제공하는 것을 목표로 합니다.
Kats는 Facebook의 인프라 데이터 과학 팀에서 출시했습니다. PyPI에서 다운로드할 수 있습니다.
greykite
1.7k
https://github.com/linkedin/greykite
그레이카이트 라이브러리는 대표 알고리즘인 실버카이트(Silverkite)를 통해 유연하고 직관적이며 빠른 예측을 제공합니다.
실버카이트 알고리즘은 대부분의 시계열에서 잘 작동하며, 특히 추세나 계절성, 이벤트/공휴일 효과, 시간적 종속성 등의 변화 지점이 있는 시계열에 적합합니다. 예측은 해석이 가능하므로 신뢰할 수 있는 의사 결정과 인사이트에 유용합니다.
그레이카이트 라이브러리는 탐색적 데이터 분석, 이상값/이상값 전처리, 특징 추출 및 엔지니어링, 그리드 검색, 평가, 벤치마킹 및 플로팅을 통해 우수한 예측 모델을 쉽게 개발할 수 있는 프레임워크를 제공합니다. 이 프레임워크를 활용하기 위해 아래 목록과 같이 다른 오픈 소스 알고리즘도 그레이카이트의 인터페이스를 통해 지원될 수 있습니다.
autots
690
https://github.com/winedarksea/AutoTS
AutoTS는 정확도가 높은 예측을 대규모로 신속하게 배포할 수 있도록 설계된 Python용 시계열 패키지입니다.
.fit() 및 .predict()의 sklearn 스타일로 사용할 수 있는 예측 모델은 수십 가지가 있습니다. 여기에는 나이브, 통계, 머신 러닝 및 딥 러닝 모델이 포함됩니다. 또한 .fit(), .transform() 및 .inverse_transform()의 sklearn 스타일에서 사용할 수 있는 30개 이상의 시계열 전용 변환이 있습니다. 이 모든 기능은 전용 객체로 변환할 필요 없이 판다스 데이터프레임에서 직접 작동합니다.
모든 모델은 다변량(다중 시계열) 출력 예측을 지원하며 확률적(상한/하한) 예측도 지원합니다. 대부분의 모델은 수만, 심지어 수십만 개의 입력 계열로 쉽게 확장할 수 있습니다. 또한 많은 모델이 사용자 정의 외생 회귀변수 전달을 지원합니다.
이러한 모델은 모두 유전 알고리즘을 통해 주어진 데이터 세트에 가장 적합한 모델, 전처리 및 앙상블을 자동으로 찾아주는 AutoML 기능 검색에 통합되도록 설계되었습니다.
수평 및 모자이크 스타일 앙상블은 대표적인 앙상블 유형으로, 각 시리즈가 확장성을 유지하면서 가능한 가장 정확한 모델을 얻을 수 있도록 해줍니다.
메트릭 및 교차 검증 옵션의 조합, 하위 집합 및 가중치 적용 기능, 회귀 분석 생성 도구, 시뮬레이션 예측 모드, 이벤트 위험 예측, 라이브 데이터 세트, 템플릿 가져오기 및 내보내기, 플로팅, 데이터 형성 매개변수 모음 등 다양한 기능을 사용할 수 있습니다.
sktime
6.3k
https://github.com/sktime/sktime
sktime은 파이썬에서 시계열 분석을 위한 라이브러리입니다. 여러 시계열 학습 작업을 위한 통합 인터페이스를 제공합니다. 현재 여기에는 시계열 분류, 회귀, 클러스터링, 주석 및 예측이 포함됩니다. 시계열 모델을 구축, 조정 및 검증할 수 있는 시계열 알고리즘과 scikit-learn 호환 도구가 함께 제공됩니다.
pyflux
2k
https://github.com/RJT1990/pyflux
PyFlux는 파이썬용 오픈 소스 시계열 라이브러리입니다. 이 라이브러리에는 다양한 최신 시계열 모델과 이러한 모델에 적용할 수 있는 유연한 추론 옵션(빈번 주의자 및 베이지안)이 있습니다. 광범위한 모델과 광범위한 추론 옵션을 결합함으로써 PyFlux는 시계열 모델링에 대한 확률론적 접근 방식을 허용합니다. PyFlux는 아직 알파 소프트웨어에 불과하므로 테스트 범위가 아직 확장되어야 하며 일부 모듈은 여전히 최적화가 필요하다는 것을 의미합니다.
prophet
15.6k
https://github.com/facebook/prophet
Prophet은 비선형 추세가 연도별, 주별, 일별 계절성과 휴일 효과에 맞는 덧셈 모델을 기반으로 시계열 데이터를 예측하는 절차입니다. 강력한 계절 효과가 있는 시계열과 여러 시즌의 과거 데이터에 가장 적합합니다. Prophet은 누락된 데이터와 추세의 변화에 강력하며 일반적으로 이상값을 잘 처리합니다.
flint
977
https://github.com/twosigma/flint
플린트: Apache Spark를 위한 시계열 라이브러리
대규모 시계열 데이터를 분석할 수 있는 능력은 Spark를 기반으로 하는 금융 및 IoT 애플리케이션의 성공을 위해 매우 중요합니다. Flint는 Spark에서 고도로 최적화된 시계열 연산을 구현한 투 시그마의 제품입니다. 시계열 데이터의 자연스러운 순서를 활용하여 지역 기반 최적화를 제공함으로써 시계열 데이터에 대해 진정으로 병렬적이고 풍부한 분석을 수행합니다.
플린트는 시계열 인식 데이터 구조인 TimeSeriesRDD를 기반으로 하는 Spark용 오픈 소스 라이브러리이며, TimeSeriesRDD를 사용하는 시계열 유틸리티 및 분석 함수 모음입니다. DataFrame 및 Dataset과 달리, Flint의 TimeSeriesRDD는 저장된 데이터 세트의 기존 순서 속성과 이러한 데이터 세트에 대한 거의 모든 데이터 조작 및 분석이 시간적 순서 속성을 존중한다는 사실을 활용할 수 있습니다. 패널 데이터 또는 대규모 고빈도 데이터에 대해 효율적으로 계산할 수 있다는 점에서 Spark의 다른 시계열 작업과 차별화됩니다.
arrow
8.2k
https://github.com/arrow-py/arrow
화살표: 파이썬을 위한 더 나은 날짜 및 시간
Arrow는 날짜, 시간 및 타임스탬프를 생성, 조작, 서식 지정 및 변환하는 데 있어 합리적이고 인간 친화적인 접근 방식을 제공하는 Python 라이브러리입니다. 날짜/시간 유형을 구현하고 업데이트하여 기능의 공백을 메우고 많은 일반적인 생성 시나리오를 지원하는 지능형 모듈 API를 제공합니다. 간단히 말해, 더 적은 가져오기 작업과 훨씬 적은 코드로 날짜와 시간 작업을 할 수 있도록 도와줍니다.
orbit
1.6k
https://github.com/uber/orbit
Orbit은 베이지안 시계열 모델링 및 추론을 위한 Python 패키지입니다. 시계열 작업을 위한 친숙하고 직관적인 초기화-맞춤-예측 인터페이스를 제공하며, 내부적으로 확률적 프로그래밍 언어를 활용합니다.
pastas
297
https://github.com/pastas/pastas
Pastas는 지하수(groundwater) 시계열을 처리, 시뮬레이션 및 분석하기 위한 오픈 소스 파이썬 패키지입니다. 객체 지향 구조로 새로운 모델 구성 요소를 빠르게 구현할 수 있습니다. 내장된 최적화, 시각화 및 통계 분석 도구를 사용하여 단 몇 줄의 파이썬 코드만으로 시계열 모델을 생성, 보정 및 분석할 수 있습니다.