LLM Chess Arena API

Локальная CLI-арена для шахматных турниров между LLM-провайдерами. Проект проверяет, как модели держат правила шахмат, выбирают легальные ходы, переживают rate limit и меняются по failover-цепочке.

Состав

python arena_v3_API_new_versu.py - основная API-арена: партии, failover, ELO команд и моделей, continuous tournaments.
python arena_v3_API.py - старая API-версия.
python arena_v3.py - ручная human-in-the-loop версия.
keys.py - безопасная загрузка и сохранение API-ключей в keys_local.json.
scout.py - проверка доступности моделей из scout_models.json.
analysis.py - анализ PGN через Stockfish.
stockfish/ - локальный Stockfish и его исходники/документация.
tournament_data*/ - результаты запусков, PGN, JSON-аналитика и hallucination logs.

Установка

python -m pip install -r requirements.txt

Для тестов:

python -m pip install -r requirements-dev.txt
python -m pytest

Запуск

python "python arena_v3_API_new_versu.py"

При первом запуске программа спросит API-ключи. Они сохраняются в keys_local.json, который должен оставаться локальным и не попадать в репозиторий.

Команды Внутри Арены

start - начать или продолжить турнир.
test - проверить подключение к моделям.
top - таблица текущего турнира.
elo - ELO моделей.
teamelo - ELO команд.
teams - цепочки моделей и cooldown.
logs - последние нелегальные ходы.
mode, submode, ormode - режим игры и выбора моделей.
key - редактировать ключи.
delays - изменить задержки и cooldown.
reset - удалить tournament_data и начать заново.

Безопасность

Не храните реальные ключи в keys.py.
Не коммитьте keys_local.json и scout_keys.json.
Не публикуйте tournament_data*, если в логах могут быть приватные prompt/ответы или внутренние имена моделей.

Ограничения

Это исследовательский CLI-инструмент, не production-сервис.
Результаты зависят от доступности API, лимитов провайдеров и текущих версий моделей.
Для строгого бенчмарка фиксируйте дату, список моделей, режим, prompt, seed/температуру и полный state.

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
.github		.github
Logs		Logs
stockfish		stockfish
tests		tests
tournament_data (new_hov_final)		tournament_data (new_hov_final)
tournament_data		tournament_data
tournament_data_1 (staryye)		tournament_data_1 (staryye)
tournament_data_2 (new_staryye)		tournament_data_2 (new_staryye)
tournament_data_3 (norm_no)		tournament_data_3 (norm_no)
tournament_data_4 (sred ploch)		tournament_data_4 (sred ploch)
tournament_data_5 (stariy_final)		tournament_data_5 (stariy_final)
tournament_data_6 (smex_new)		tournament_data_6 (smex_new)
tournament_data_7 (final nesprav pars)		tournament_data_7 (final nesprav pars)
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
analysis.py		analysis.py
keys.py		keys.py
python arena_v3.py		python arena_v3.py
python arena_v3_API-2py		python arena_v3_API-2py
python arena_v3_API.py		python arena_v3_API.py
python arena_v3_API_new_versu.py		python arena_v3_API_new_versu.py
python-arena-API.py		python-arena-API.py
requirements-dev.txt		requirements-dev.txt
requirements.txt		requirements.txt
scout.py		scout.py
scout_config.json		scout_config.json
scout_models.json		scout_models.json
scout_models_star)no_actual.json		scout_models_star)no_actual.json
scout_rezerv.py		scout_rezerv.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

LLM Chess Arena API

Состав

Установка

Запуск

Команды Внутри Арены

Безопасность

Ограничения

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

LLM Chess Arena API

Состав

Установка

Запуск

Команды Внутри Арены

Безопасность

Ограничения

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages