این دستور ids2ngram است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
IDS2ngram - فایل داده n-gram را از فایل ids تولید کنید
خلاصه
IDs2ngram [انتخاب] ... ids_file...
شرح
IDs2ngram فایل idngram را تولید می کند که یک آرایه مرتب شده [id1,..,idN,freq] از باینری است.
فایل های استریم شناسه در اینجا، فایل های جریان id همیشه توسط تولید می شوند mmseg or slmseg.
اساساً، همه موارد n-word تاپل (یعنی تاپل (id1,..,idN)) را پیدا می کند.
این تاپل ها را بر اساس ترتیب واژگانی شناسه های تشکیل دهنده تاپل ها مرتب می کند، سپس بنویسد
آنها را به فایل خروجی مشخص شده.
INPUT
فایل ورودی به صورت یک جریان شناسه باینری ارائه می شود که به نظر می رسد:
[id0,...,idX]
OPTIONS
تمام گزینه های زیر اجباری هستند.
-n,--N حداکثر N
تولید می کند Nنتیجه - گرم IDs2ngram فقط uni-gram، bi-gram و trigram را پشتیبانی می کند،
بنابراین هر عددی که در محدوده 1..3 نباشد معتبر نیست.
-s,-- تعویض فایل مبادله
فایل میانی موقت را مشخص کنید.
-o, -- خارج فایل خروجی
فایل idngram نتیجه را مشخص کنید، به عنوان مثال آرایه [id1, ..., idN, freq]
-p, -- پاراگراف N
حداکثر موارد n گرم در هر پاراگراف را مشخص کنید. IDs2ngram در فایل موقت می نویسد
بر اساس هر پاراگراف هر بار که یک پاراگراف را می نویسد، آن را آزاد می کند
حافظه مربوطه به آن اختصاص داده شده است. هنگامی که سیستم کامپیوتر شما اجازه می دهد، بالاتر است N
پیشنهاد می شود. این می تواند سرعت پردازش را به دلیل ورودی/خروجی کمتر افزایش دهد.
مثال
مثال زیر از سه ورودی فایل idstream idsfile[1,2,3] برای تولید استفاده میکند
فایل idngram all.id3gram. هر پارا (اندازه نقشه داخلی یا اندازه هش) 1024000 خواهد بود،
با استفاده از فایل swap برای نتیجه موقت. تمام نتایج دمایی در نهایت با هم ادغام می شوند تا به دست آید
نتیجه نهایی
IDs2ngram -n 3 -s /tmp/swap -o all.id3gram -p 1024000 idsfile1 idsfile2 idsfile3
با استفاده از خدمات onworks.net به صورت آنلاین از IDs2ngram استفاده کنید