Ini adalah perintah likwid-perfctr yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, Windows online emulator atau MAC OS online emulator
PROGRAM:
NAMA
likwid-perfctr - konfigurasikan dan bacakan penghitung kinerja perangkat keras pada cpus x86
RINGKASAN
likwid-perfctr [-vhHVmaeiMoO] [-c/-C ] [-g or
] [-t ] [-S ] [-s ] [-o
]
DESKRIPSI
likwid-perfctr adalah aplikasi baris perintah yang ringan untuk dikonfigurasi dan dibaca
data pemantauan kinerja perangkat keras pada prosesor x86 yang didukung. Itu dapat mengukur baik sebagai
pembungkus tanpa mengubah aplikasi yang diukur atau dengan fungsi API penanda di dalam
kode, yang akan menghidupkan dan mematikan penghitung. Ada grup yang telah dikonfigurasi sebelumnya dengan yang berguna
set peristiwa dan metrik turunan. Acara tambahan yang sewenang-wenang dapat diukur dengan kebiasaan
set acara. API penanda dapat mengukur beberapa wilayah bernama. Hasil diakumulasikan pada
beberapa panggilan. Prosesor x86 berikut didukung:
· Intel Core 2: semua varian. Penghitung: PMC[0-1], PERBAIKIC[0-2]
· Intel Nehalem: Penghitung: PMC[0-3], PERBAIKIC[0-2], UPMC[0-7]
· Intel Nehalem EX: Penghitung: PMC[0-3], PERBAIKIC[0-2], MBOX[0-1]C[0-5], BBOX[0-1]C[0-3],
RBOX[0-1]C[0-7], WBOX[0-5], UBOX0, KOTAK[0-1]C[0-3], CBOX[0-9]C[0-4]
· Intel Barat:
Penghitung: PMC[0-3], PERBAIKIC[0-2], UPMC[0-7]
· Intel Westmere EX: Penghitung: PMC[0-3], PERBAIKIC[0-2], MBOX[0-1]C[0-5], BBOX[0-1]C[0-3],
RBOX[0-1]C[0-7], WBOX[0-5], UBOX0, KOTAK[0-1]C[0-3], CBOX[0-9]C[0-4]
· Intel Sandy Jembatan: dukungan penuh RAPL. Penghitung: PMC[0-3], PERBAIKIC[0-2], PWR[0-3]
· Intel Sandy Jembatan EP: dukungan parsial untuk uncore, dukungan RAPL penuh. Penghitung:
PMC[0-3], PERBAIKIC[0-2], PWR[0-3]. MBOX[0-3]C[0-3]
· Intel Ivy Jembatan: dukungan penuh RAPL. Penghitung: PMC[0-3], PERBAIKIC[0-2], PWR[0-3]
· Intel Ivy Jembatan EP: dukungan parsial untuk uncore, dukungan RAPL penuh. Penghitung:
PMC[0-3], PERBAIKIC[0-2], PWR[0-3], KOTAK[0-9]C[0-3], MBOX[0-3]C[0-3], MBOX[0-3]PERBAIKI
· Intel Haswell: dukungan penuh RAPL. Penghitung: PMC[0-3], PERBAIKIC[0-2], PWR[0-3]
· Intel Haswell EP: tidak ada dukungan uncore, dukungan RAPL penuh. Penghitung: PMC[0-3],
PERBAIKIC[0-2], PWR[0-3]
· Intel Atom Perakmont: dukungan penuh RAPL. Penghitung: PMC[0-1], PERBAIKIC[0-2], PWR[0-1]
· Intel Pentium M: Varian Banias dan Dothan. Penghitung: PMC[0-1]
· Intel Q6: Diuji pada P3.
· AMD K8: semua varian. Penghitung: PMC[0-3]
· AMD K10: Barcelona, Shanghai, Istanbul, prosesor berbasis MagnyCours. Penghitung:
PMC[0-3]
PILIHAN
-v mencetak informasi versi ke output standar, lalu keluar.
-h mencetak pesan bantuan ke output standar, lalu keluar.
-H mencetak pesan bantuan grup (digunakan bersama dengan -g switch).
-V keluaran verbose selama eksekusi untuk debugging.
-m jalankan dalam mode API penanda
-a mencetak kelompok kinerja yang tersedia untuk prosesor saat ini.
-e mencetak penghitung yang tersedia dan peristiwa kinerja prosesor saat ini.
-o
simpan semua output ke file alih-alih stdout. Untuk nama file berikut:
placeholder didukung: %j untuk PBS_JOBID, %r untuk MPI RANK (hanya Intel MPI di
saat ini), %h hostname dan %p untuk proses pid. Placeholder harus
dipisahkan dengan garis bawah sebagai, misalnya, -o test_%h_%p. Anda harus menentukan akhiran untuk
nama file. Untuk txt, output dicetak apa adanya ke file. Sufiks lainnya memicu a
filter pada keluaran. Filter yang tersedia adalah csv (nilai yang dipisahkan koma) dan xml
saat ini.
-O Jangan mencetak tabel untuk hasil, gunakan CSV yang mudah diurai.
-i mencetak informasi cpuid tentang prosesor dan Intel Performance Monitoring
fitur, lalu keluar.
-c
tentukan daftar numerik prosesor. Daftar mungkin berisi beberapa item,
dipisahkan dengan koma, dan rentang. Misalnya 0,3,9-11.
-C
tentukan daftar numerik prosesor. Daftar mungkin berisi beberapa item,
dipisahkan dengan koma, dan rentang. Misalnya 0,3,9-11. Varian ini juga akan menyematkan
benang ke inti. Penomoran logis juga dapat digunakan.
-g <kinerja grup> or <kinerja peristiwa set tali>
menentukan kelompok kinerja mana yang akan diukur. Ini bisa menjadi salah satu keluaran tag dengan
bendera -a. Juga rangkaian acara khusus dapat ditentukan dengan daftar yang dipisahkan koma dari
acara. Setiap acara memiliki format eventId:register dengan register menjadi satu
register penghitung kinerja yang didukung arsitektur.
-t <frekuensi of pengukuran>
mode garis waktu untuk pengukuran yang diselesaikan waktu, kemungkinan sufiks 's' dan 'ms' seperti
100ms. Outputnya memiliki format:
<Hasil utas0> <Hasil utas1> ...
-S
mode stetoskop dengan durasi dalam detik. Dapat digunakan untuk mengukur aplikasi
dari luar.
CONTOH
Karena likwid-perfctr langkah-langkah pada prosesor dan bukan aplikasi tunggal itu perlu
untuk memastikan bahwa proses dan utas disematkan ke sumber daya khusus. Anda dapat menyematkan
aplikasi sendiri atau gunakan fungsi pin bawaan.
1. Sebagai pembungkus dengan grup pertunjukan:
likwid-perfctr -C 0-2 -g TLB ./cacheBench -n 2 -l 1048576 -i 100 -t Aliran
Proses induk disematkan ke prosesor 0, Thread 0 ke prosesor 1 dan Thread 1 ke
prosesor 2.
2. Sebagai pembungkus dengan acara khusus yang diatur pada AMD:
likwid-perfctr -C 0-4 -g INSTRUCTIONS_RETIRED_SSE:PMC0,CPU_CLOCKS_UNHALTED:PMC3 ./aplikasiku
Ditentukan bahwa acara INSTRUCTIONS_RETIRED_SSE diukur pada counter PMC0 dan
acara CPU_CLOCKS_UNHALTED di konter PMC3. Hal ini dimungkinkan untuk menghitung runtime dari
semua utas berdasarkan CPU_CLOCKS_UNHALTED peristiwa. Jika Anda menginginkan ini, Anda harus menyertakan
acara ini di string acara khusus Anda seperti yang ditunjukkan di atas.
3. Sebagai pembungkus dengan acara khusus yang diatur pada Intel:
likwid-perfctr -C 0 -g INSTR_RETIRED_ANY:FIXC0,CPU_CLK_UNHALTED_CORE:FIXC1 ./aplikasiku
Pada prosesor Intel, kejadian tetap diukur pada penghitung khusus. Ini adalah
INSTR_RETIRED_ANY , CPU_CLK_UNHALTED_CORE. dan CPU_CLK_UNHALTED_REF Jika Anda mengonfigurasi
penghitung tetap ini, likwid-perfctr akan menghitung metrik runtime dan CPI untuk
menjalankan.
4. Menggunakan API penanda untuk mengukur hanya sebagian dari kode Anda (ini dapat digunakan dengan
grup atau rangkaian acara khusus):
likwid-perfctr -m -C 0-4 -g INSTRUCTIONS_RETIRED_SSE:PMC0,CPU_CLOCKS_UNHALTED:PMC3
./cacheBench
Anda harus menautkan kode Anda ke liblikwid.a/.so dan menggunakan panggilan API penanda. NS
cuplikan kode berikut menunjukkan panggilan yang diperlukan:
#termasuk
/* hanya satu thread yang memanggil init */
jika (id-utas == 0)
{
likwid_markerInit();
}
/* jika Anda ingin mengukur aplikasi berulir
* Anda harus memanggil likwid_markerThreadInit() untuk
* persiapan, contoh dengan OpenMP */
#pragma omp paralel
{
likwid_markerThreadInit();
}
PENGHALANG;
likwid_markerStartRegion("Tolok ukur");
/* kode Anda yang akan diukur ada di sini.*/
likwid_markerStopRegion("Tolok ukur");
PENGHALANG;
/* sekali lagi hanya satu utas yang dapat menutup penanda */
jika (id-utas == 0)
{
likwid_markerClose();
}
5. Menggunakan likwid dalam mode timeline:
likwid-perfctr -c 0-3 -g FLOPS_DP -t 300ms ./aplikasiku > keluar.txt
Ini akan membacakan penghitung setiap 300 ms pada inti fisik 0-3 dan menulis hasilnya ke
keluar.txt. Untuk mode timeline ada aplikasi frontend likwid-scope, yang memungkinkan
plotting langsung dari acara yang dipilih. Untuk contoh kode lainnya, lihat likwid WIKI
halaman. Proses-proses tersebut adalah tidak disematkan ke CPU 0-3.
6. Menggunakan likwid dalam mode stetoskop:
likwid-perfctr -c 0-3 -g FLOPS_DP -S 2s
Ini akan memulai penghitung dan membacanya setelah 2 detik pada inti fisik 0-3 dan menulis
hasilnya ke stdout. Proses-proses tersebut adalah tidak disematkan ke CPU 0-3.
Gunakan likwid-perfctr online menggunakan layanan onworks.net