Jak działa RTZ Auction Lab
RTZ Auction Lab jest aplikacją badawczą służącą do walidacji i eksperymentalnego przeprojektowania mechanizmu aukcyjnego dla frakcjonalizowanych strumieni tantiem. Aplikacja porównuje wariant historyczny, walidowany punkt odniesienia oraz wariant przeprojektowany oceniany w symulacji wieloagentowej.
Struktura strony głównej
Strona główna jest interfejsem eksperymentalnym. U góry widzisz cel, sposób realizacji i hipotezy, po lewej suwaki eksperymentu, a po prawej wyniki kolejnych przebiegów. Aplikacja porównuje trzy wersje mechanizmu: historyczną, walidowaną i przeprojektowaną.
W pierwszej kolejności należy sprawdzić trzy kwestie: czy mechanizm utrzymuje przychód sprzedającego, czy alokacja nie premiuje nadmiernie Red Teamu oraz czy realne segmenty rynku uzyskują udział zbliżony do docelowej struktury alokacji.
Kontekst przedmiotu badania
Przedmiotem symulacji nie jest standardowe dobro jednorazowej konsumpcji, lecz udział w przyszłych przychodach z katalogu muzycznego, czyli frakcjonalizowane prawo do strumieni tantiem. Katalog może generować wpływy z odtworzeń, synchronizacji, emisji lub innych form eksploatacji, a inwestor nabywa udział w ekonomicznym strumieniu wartości.
Taki rynek jest trudniejszy niż klasyczna sprzedaż, bo uczestnicy nie wyceniają tylko dzisiejszej ceny. Każdy buduje własne oczekiwanie: jak długo katalog będzie słuchany, jak stabilny jest repertuar, czy popularność będzie wygasać, czy może wzrosnąć po nowym trendzie, serialu albo kampanii. Dlatego w symulacji każdy agent ma własną wartość prywatną i budżet.
Dlaczego to nie jest klasyczna aukcja holenderska
W klasycznej aukcji holenderskiej cena spada, aż ktoś ją zaakceptuje. Tutaj sytuacja jest bogatsza: sprzedawanych jest wiele frakcji jednego katalogu, a każdy uczestnik ma nie tylko maksymalną cenę, lecz także budżet. To znaczy, że popyt zależy od ceny i od tego, ile frakcji inwestor może realnie kupić.
Mechanizm łączy elementy aukcji holenderskiej, aukcji wielojednostkowej oraz reguły alokacji budżetowej. Z tego powodu wynik zależy nie tylko od poziomu ceny, lecz także od reguły clearingu, zaokrągleń i sposobu alokacji frakcji.
Typy agentów
Agenci są syntetycznymi uczestnikami rynku. Nie reprezentują konkretnych osób, lecz typowe role inwestycyjne, które mogą reagować inaczej na cenę, ryzyko i oczekiwany zwrot.
Cel, realizacja i hipotezy
Szybkie akcje
Pipeline obliczeń
- Testy niezmienników sprawdzają, czy silnik symulacji zachowuje podstawowe własności.
- RTZ v1.0 legacy odtwarza historyczną logikę oryginalnego kodu.
- RTZ v1.1 validated jest właściwym baseline'em badawczym.
- RTZ v2.1 redesign wyznacza kandydacką konfigurację mechanizmu z bramką przychodową RR ≥ 0.90.
- Ablacja pokazuje, które parametry mechanizmu wpływają na wynik.
- Krzywa uczenia sprawdza, czy dłuższe uczenie agentów zmienia metryki.
- Eksport zapisuje CSV, LaTeX i JSON.
Co oznacza redesign mechanizmu
Redesign nie oznacza, że aplikacja projektuje nową aukcję od zera. Oznacza wybór parametrów istniejącego mechanizmu: ceny minimalnej, liczby frakcji, reguły alokacji, typu kroku cenowego i limitu koncentracji. Celem jest znalezienie konfiguracji, która daje lepszy kompromis między przychodem, efektywnością, kompletnością sprzedaży, fairness i odpornością.
Najważniejsze jest porównanie v2.1 do v1.1, nie do v1.0. RTZ v1.0 dostarcza rekonstrukcji historycznej, RTZ v1.1 stanowi właściwy baseline badawczy, a RTZ v2.1 pozwala ocenić, czy zmiana parametrów mechanizmu poprawia wynik bez nadmiernej utraty przychodu.
Wersje RTZ
Parametry sterujące
Jak działa search v2.1
Search składa się z trzech etapów.
To nie jest jeszcze pełne BOHB. Każdy kandydat wskazany przez Bayesian-lite nadal jest sprawdzany pełnym symulatorem.
W v2.1 ranking działa dwuetapowo: najpierw powstaje ranking best feasible po kandydatkach z RR ≥ 0.90, a osobno raportowany jest best trade-off. Reguła kroku adaptive nie jest usunięta, ale dostaje karę ryzyka w rankingu v2.1, ponieważ wcześniejsze przebiegi wskazały, że często poprawiała FI kosztem RR.
Metryki i matematyka
Jak interpretować wyniki
Porównuj v2.1 przede wszystkim z v1.1 validated. v1.0 jest potrzebne jako historyczna rekonstrukcja, ale nie jest normatywnym baseline'em badawczym.
Dobry wynik to nie tylko wysoki selection. W v2.1 podstawowy wybór konfiguracji jest revenue-gated: kandydat powinien spełniać RR ≥ 0.90, a dopiero potem poprawiać Exploitation Gap i Fairness Index.
Ryzyka interpretacyjne
Walidacja i PASS/FAIL
Testy walidacyjne sprawdzają podstawowe własności silnika: zgodność legacy z oryginałem, wykonalność budżetową w validated, clearing i poprawne traktowanie Red Teamu.
PASS oznacza, że test niezmiennika przeszedł. FAIL oznacza, że wynik eksperymentu trzeba traktować jako niewiarygodny, dopóki silnik nie zostanie poprawiony.
Ablacja
Ablacja zmienia po jednym parametrze i sprawdza wpływ na metryki. Dzięki temu widać, czy wynik v2.1 wynika z całego searchu, czy głównie z jednego parametru, np. granularności S, reguły alokacji albo limitu koncentracji.
Krzywa uczenia
Krzywa uczenia porównuje wyniki dla różnych wartości T_learn. Jeżeli selection rośnie przy dłuższym uczeniu, agenci potrzebują więcej czasu na adaptację. Jeżeli wynik się stabilizuje, dalsze zwiększanie T_learn może być mniej opłacalne niż zwiększenie repetycji.
Autopilot i rekomendacje
Autopilot działa w pętli: uruchomienie, interpretacja wyników, wybór kolejnych parametrów, przesunięcie seedów, kolejne uruchomienie. Uzasadnienia obok rekomendacji mówią, czy problem wygląda na search-limited, learning-limited, revenue-constrained czy evaluation-noise-limited.
Po każdym przebiegu aplikacja zapisuje wynik do historii sesji i wyznacza ocenę hipotez H1 oraz H2. H1 dotyczy jednoczesnej poprawy FI, obniżenia EG i zachowania bariery RR ≥ 0.90. H2 dotyczy wpływu T_learn, Bayesian-lite i stabilności wyników między przebiegami.
Limit autopilota określa długość jednej uruchamianej serii, a nie limit archiwum. Historia iteracji zbiera wszystkie przebiegi z bieżącej sesji, wraz z seedBase, seedSearch, metrykami, konfiguracją v2.1 oraz oceną H1/H2.
Główne podsumowanie w aplikacji jest agregowane po całej historii autopilota. Pełny zestaw wyników pojedynczego przebiegu otwiera się kliknięciem odpowiedniego wiersza w Historii iteracji.
Wyniki są zapisywane w pamięci sesji przeglądarki, dlatego przejście na stronę Pomocy i powrót do aplikacji nie usuwa historii. Dane pozostają dostępne w tej samej karcie przeglądarki do czasu zamknięcia sesji albo zastąpienia ich nowymi przebiegami.
Eksport
Ograniczenia
Obecna wersja nie jest pełnym MARL, pełnym BOHB ani produkcyjnym systemem aukcyjnym. To walidowane laboratorium eksperymentalne. Najważniejsze ograniczenia to stylizowany model rynku, agenci bandit zamiast deep RL oraz uproszczony Bayesian-lite zamiast formalnej optymalizacji bayesowskiej.