Üç pekiştirmeli öğrenme modeli, bir meta-seçici ve net sınırlamalar. Kaputun altında ne çalışıyor — ve ne çalışmıyor. Tam görüntü.
Yürütme motorumuz farklı uzmanlıklara sahip üç pekiştirmeli öğrenme modelinden oluşur. Her biri actor-critic kurgulu PPO (Proximal Policy Optimization) tabanlı mimari kullanır. Modeller sürekli yeniden eğitilmez — ağırlıkları üç ayda bir, sıkı örneklem dışı doğrulamadan sonra güncelleriz.
Modellerimiz üç kategori veri işler:
Modellerimizin tüm piyasa rejimlerini eşit derecede iyi yönettiğini iddia etmiyoruz. Kara kuğu olaylarını öngördüklerini iddia etmiyoruz. Geçmiş performansın gelecek sonuçların göstergesi olduğunu iddia etmiyoruz. İddia ettiğimiz: net risk limitleriyle disiplinli algoritmik yürütme, duygusal kararlardan üstün uzun vadeli sonuç verir.
Algoritmalar kâhin değildir. Aşırı, daha önce görülmemiş piyasa koşullarında modellerimiz kayıp üretecektir. Sistemin doğası bu — hiçbir model hiç görmediğine hazırlanmaz.
Sıkı yürüteç doğrulama metodolojisi kullanıyoruz. Modeller geçmiş verinin %80'inde eğitilir ve kalan %20'sinde doğrulanır. Eğitimde asla gelecek verisi kullanmayız (ileri bakış önyargısı yok). İşlem maliyetlerini tam hesaplarız: spreadler, komisyonlar ve gerçekçi slipaj dahil. Örneklem dışında başarısız modeller üretime çıkmaz.
Araştırma ekibimiz iş ve pazarlamadan örgütsel olarak ayrıdır. Araştırma Başkanı CEO'ya değil, doğrudan Yönetim Kurulu'na rapor verir. Bir model kötü performans gösterdiğinde aylık notta açıkça söyleriz — kozmetik için sonuçları kırpmayız. Bu ayrım iç yönetmeliklerimizde yer alır ve Kurul tarafından yıllık incelenir.
Son model performansı, metodolojik iyileştirmeler ve son piyasa koşullarından çıkarılan derslerin ayrıntılarıyla üç ayda bir teknik notlar editör bölümümüzde yayımlıyoruz. Pazarlama dili olmadan yazılırlar ve teknik açıdan ilgilenen abonelere yöneliktir.