Posiedzenie z udziałem Reprezentantów ośrodków KDM -- Sygnatariuszy Porozumienia Polish WLCG oraz Przedstawicieli eksperymentów: ALICE, ATLAS, CMS, LHCb.
https://cyfronet.zoom.us/j/98047403758
Minuty z posiedzenia Sygnatariuszy Porozumienia Polish-WLCG z polskimi reprezentantami eksperymentów LHC w dniu 27.06.2023, godz. 14:00
Uczestnicy:
Porządek:
https://events.plgrid.pl/event/35/
@3. Realizacja zobowiązań centrów KDM w 2022 i 2023
Prof. J. Kitowski przedstawił prezentacje odnośnie realizacji zobowiązań polskich KDM (prezentacja) za okres 01.04.2022-31.03.2023.
Komentarz: Radosław Januszewski
PCSS na potrzeby ALICE rezerwuje ok 2-3 tysiące rdzeni obliczeniowych (wartość fluktuje w czasie) ale wyraźnie widać, że ekperyment nie wykorzystuje tych zasobów i przeważnie liczba zaalokowanych rdzeni nie przekracza 1.1 tysiąca (wykres poniżej).
Co prawda do początku marca 2022 kolejki miały skonfigurowany zbyt krótki czas walltime i ~ ⅓ zadań kończyła się błedem ale zostało to poprawione.
Konkluzje:
Wygląda na to, że po stronie PCSS wszystko w przedstawianym okresie rozliczeniowym działa poprawnie, odpowiednia moc obliczeniowa jest dostarczona, a zadania wykonują sie w większości z sukcesem (@Marcin Pospieszny: ponad 90%). Biorąc pod uwage powyższe można wnioskować, że to eksperyment z nieznanych powodów nie wykorzystuje dostępnej mocy obliczeniowej, co jest niekorzystne dla dostawcy (PCSS) bo generuje koszty, a z drugiej strony w sprawozdaniach wygląda jakby nie wywiązywał się z zobowiązań. Dotychczasowe interwencje administratorów PCSS nie przyniosły rezultatu, dlatego prof. Marek Kowalski ma skontaktowac się z Latchezarem Betevem aby wyjaśnić sytuację.
Dr N. Meyer zauważył, że sytuacja z wykorzystaniem storage jest analogiczna do przypadku ALICE, tj zasoby są udostępniane, ale nie są wykorzystywane przez eksperyment. Z punktu widzenia KDM wszelkie zobowiązania są wypełnione, a mimo to w raportach wykazywane jest co innego (realne wykorzystanie) - powinniśmy w tej sprawie interweniować.
Przy czym należy zauważyć, ze ponieważ ACK Cyfronet udostępnia zasoby od niedawna, należy jeszcze chwilę poczekać.
Więcej uwag nie zgłoszono.
@4. Ustalenia na 2023 w zakresie wielkości “pleges” - terminy!
Propozycja terminu dostarczenia wartości pledges na 2024: 15.09.2023
@5a. Informacje z posiedzenia C-RRB (kwiecien 2023) (Michał Bluj)
Najważniejsze punkty:
@5b. Informacje z posiedzenia GDB (maj 2023) (prof. Jacek Kitowski)
prezentacja (od slajdu 11)
Najważniejsze punkty:
Dyskusja:
Pytania:
prof. W. Wiślicki: Benchmark HS06 bazuje na benchmarku SPEC, to jest duży zbior testow , czy nowy HS23 jest z niego adaptowany, czy jest coś zupełnie nowego?
prof. Jacek Kitowski: Trudno powiedzic w jaki sposob jest to rozwijane w CERNie, ale jest to zoptymalizowane z uwzględnieniem architektur innych niż x86, i ma uwzglednic róźnice między serwerami klienckimi a serwerowymi. Ma też uwzględniać performance energetyczny.
Marek Magryś: Problem polega na tym, że benchmark SPEC jest aplikacją płatną - benchamrkowanie było uciążliwe i wolno podążało za nowymi architekturami, a HEPScore bazuje na kontenerach – przez co umożliwia łatwiejsze uruchomienie i ew. wyważenie wyników.
@6. AOB
brak
@7. Dokumentacja HEPScore23
Artykuł o HEPScore: https://arxiv.org/pdf/2306.08118.pdf
Źródła: https://gitlab.cern.ch/hep-benchmarks/hep-score
Selected GDB meetings (access rights required)
13.9.2023 https://indico.cern.ch/event/1225116/ (monitoring&HS23)
11.10.2023 https://indico.cern.ch/event/1225117/ (Euro Science Gateway&ARM)
7.11.2023 https://indico.cern.ch/event/1225131/ (tapes)
8.11.2023 https://indico.cern.ch/event/1225118/ (GPU)