متریک‌های Tor

اصلاً چگونه می‌توان در یک شبکهٔ ناشناس، کاربران را شمرد؟

ما در حقیقت کاربران را نمی‌شماریم، بلکه تعداد درخواست‌هایی را می‌شماریم که کلاینت‌ها به‌طور دوره‌ای برای به‌روزرسانی فهرست رله‌های خود به شاخه‌ها ارسال می‌کنند، و از آن‌جا تعداد کاربران را به‌طور غیرمستقیم تخمین می‌زنیم.

ویرایش این صفحه - این ترجمه را بهبود دهید - پیشنهاد بازخورد - لینک دائمی

آیا همهٔ شاخه‌ها این شماره‌های درخواست شاخه را گزارش می‌کنند؟

نه، ولی ما می توانیم ببینیم چه کسری از فهرست‌ها آن‌ها را گزارش کرده‌اند، و آن‌گاه می‌توانیم تعداد کل را در شبکه را برون‌یابی کنیم.

ویرایش این صفحه - این ترجمه را بهبود دهید - پیشنهاد بازخورد - لینک دائمی

چگونه از این درخواست‌های شاخه به تعداد کاربر می‌رسید؟

ما این فرض را داریم که کلاینت به‌طور متوسط روزانه ۱۰ درخواست این‌چنینی را ثبت می‌کند. یک کلاینت Tor که ۲۴/۷ متصل است حدود ۱۵ درخواست در روز ارسال می‌کند، اما همه کلاینت‌ها ۲۴/۷ متصل نیستند، بنابراین ما عدد ۱۰ را برای متوسط هر کلاینت برگزیدیم. ما درخواست‌های شاخه را تقسیم بر ۱۰ می‌کنیم و نتیجه را به‌عنوان تعداد کاربر در نظر می‌گیریم. راه دیگری برای نگاه‌ کردن به این موضوع این است که ما فرض کنیم که هر درخواست نمایانگر کلاینتی است که یک‌دهم روز، یعنی۲ ساعت و ۲۴ دقیقه، آنلاین می‌ماند.

ویرایش این صفحه - این ترجمه را بهبود دهید - پیشنهاد بازخورد - لینک دائمی

بنابراین، آیا این‌ها کاربران متمایز در هر روز، میانگین تعداد کاربران متصل در طول روز یا چه هستند؟

میانگین تعداد کاربران همزمان، از داده‌های جمع‌آوری‌شده در طول یک روز تخمین زده می‌شود. ما نمی‌توانیم بگوییم چند کاربر متمایز وجود دارد.

ویرایش این صفحه - این ترجمه را بهبود دهید - پیشنهاد بازخورد - لینک دائمی

آیا داده‌های جزئی‌تری موجود است، مثلاً در مورد تعداد کاربران در هر ساعت؟

نه، رله‌هایی که این آمار را گزارش می‌کنند درخواست‌ها را از کشور‌های مبدا و در یک دوره 24 ساعته جمع می‌کنند. جمع‌آوری آماری که برای تعداد کاربران در هر ساعت نیاز داریم پرجزئیات خواهد بود و ممکن است کاربران را در معرض خطر قرار دهد.

ویرایش این صفحه - این ترجمه را بهبود دهید - پیشنهاد بازخورد - لینک دائمی

آیا این‌ها کلاینت یا کاربر Tor هستند؟ اگر بیش از یک کاربر پشت کلاینت Tor وجود داشته باشد چه؟

بدین‌سان ما آن کاربران را یک کاربر محسوب می‌کنیم. در واقع، ما کلاینت‌ها را می‌شماریم، اما برای بیشتر افراد تصور کاربر قابل‌درک‌تر است، برای همین است که می‌گوییم کاربر و نه کلاینت.

ویرایش این صفحه - این ترجمه را بهبود دهید - پیشنهاد بازخورد - لینک دائمی

اگر کاربری Tor را روی یک لپ‌تاپ اجرا کند و در روز چند بار آدرس IP خود را تغییر دهد، چه می‌شود؟ آیا آن کاربر را بیش‌از یک بار نمی‌شمارید؟

نه، چون آن کاربر فهرست رله‌های خود را به اندازهٔ کاربری به‌روز‌رسانی می‌کند که نشانی IP خود را در طول روز تغییر نمی‌دهد .

ویرایش این صفحه - این ترجمه را بهبود دهید - پیشنهاد بازخورد - لینک دائمی

از کجا متوجه می‌شوید که کاربران از کدام کشورها می‌آیند؟

فهرست‌ها نشانی‌های IP را به کدهای کشور ترجمه کرده و این اعداد را در یک فرم تجمیعی گزارش می‌کنند. این یکی از دلایلی است که Tor با یک پایگاه‌دادهٔ GeoIP عرضه می‌شود.

ویرایش این صفحه - این ترجمه را بهبود دهید - پیشنهاد بازخورد - لینک دائمی

چرا تعداد کمی از کاربران پل از پروتکل پیش‌فرض OR استفاده نمی‌کنند یا از IPv6 استفاده می‌کنند؟

تعداد کمی از پل‌ها داده‌هایی در مورد انتقال‌ها و نسخه‌ٔ IP گزارش می‌کنند، و به‌صورت پیش‌فرض ما فرض می‌کنیم درخواست‌ها از پروتکل پیش‌فرض OR و IPv4 استفاده ‌می‌کنند. هنگامی که پل‌های بیشتری این داده‌ها را گزارش کنند، اعداد دقیق‌تر خواهند شد.

ویرایش این صفحه - این ترجمه را بهبود دهید - پیشنهاد بازخورد - لینک دائمی

چرا نمودارها در ۲ روز پیش پایان یافته‌اند و نه امروز؟

رله‌ها و پل‌ها برخی داده‌ها را در بازه‌های ۲۴-ساعتی گذشته گزارش می‌کنند که ممکن است در پایان روز به اتمام برسد.
و پس از اینکه چنین بازه‌ای تمام شد رله‌ها و پل‌ها ممکن است ۱۸ ساعت دیگر زمان ببرند تا داده‌ها را گزارش کنند.
ما دو روز آخر را از نمودار‌ها کنار می گذاریم، چون می‌خواهیم از این‌که آخرین نقطهٔ داده در یک نمودار نشان‌دهندهٔ یک تغییر روند باشد جلوگیری کنیم که درواقع صرفاً اثر مصنوعی ناشی از الگوریتم است.

ویرایش این صفحه - این ترجمه را بهبود دهید - پیشنهاد بازخورد - لینک دائمی

اما من متوجه شدم که آخرین نقطهٔ داده نسبت به آخرین باری که چند ساعت پیش نگاه کردم، کمی بالا/پایین رفت. دلیل آن چیست؟

دلیل آن این است که ما زمانی تعداد کاربران را منتشر می کنیم که مطمئن باشیم که دیگر به‌صورت قابل‌توجهی تغییر نخواهند کرد. اما همیشه این احتمال وجود دارد که یک فهرست چند ساعت پس از اطمینان کافی ما داده‌ها را گزارش کند، که این نمودار را اندکی تغییر می‌دهد.

ویرایش این صفحه - این ترجمه را بهبود دهید - پیشنهاد بازخورد - لینک دائمی

چرا هیچ شماره‌ای قبل از سپتامبر ۲۰۱۱ در دسترس نیست؟

ما آرشیوهای توصیفگرهای مربوط به پیش از این زمان را داریم، اما آن توصیف‌گر‌ها همهٔ داده‌هایی را که ما برای تخمین تعداد کاربران استفاده می‌کنیم، در بر نداشتند. لطفاً تاربال زیر را برای جزئیات بیشتر پیدا کنید:

Tarball

ویرایش این صفحه - این ترجمه را بهبود دهید - پیشنهاد بازخورد - لینک دائمی

چرا فکر می‌کنید که رویکرد فعلی برای تخمین تعداد کاربران دقیق‌تر است؟

برای کاربران مستقیم، ما همهٔ شاخه‌هایی که در رویکرد قدیمی در نظر نمی‌گرفتیم را لحاظ می‌کنیم. ما از تاریخ‌هایی استفاده می‌کنیم که فقط حاوی بایت‌هایی هستند مه نوشته‌شده‌اند تا به درخواست‌های شاخه پاسخ دهند، که از استفاده تاریخ‌های بایت عمومی دقیق‌تر هستند.

ویرایش این صفحه - این ترجمه را بهبود دهید - پیشنهاد بازخورد - لینک دائمی

و دربارهٔ مزیت رویکرد کنونی نسبت به رویکرد قدیمی زمانی که به کاربران پل می‌رسیم چطور؟

اوه، این داستانی کاملاً متفاوت است. ما یک گزارش فنی ۱۳ صفحه‌ای در توضیح دلایل کنارگذاری رهیافت قدیمی نوشتیم.
به‌طور خلاصه: در رهیافت قدیمی چیز اشتباهی را اندازه‌گیری می‌کردیم، و حالا چیز درستی را اندازه‌گیری می‌کنیم.

ویرایش این صفحه - این ترجمه را بهبود دهید - پیشنهاد بازخورد - لینک دائمی

این نقاط آبی و قرمز که نشانگر رویدادهای سانسور ممکن هستند چیستند؟

ما یک سیستم تشخیص سانسور مبتنی بر ناهنجاری اجرا می‌کنیم که به تعداد کاربران در چندین روز نگاه می‌کند و تعداد کاربران را در روزهای آتی پیش‌بینی می‌کند. اگر عدد واقعی بالاتر یا پایین‌تر باشد، این شاید امکان یک رویداد سانسور یا قطع سانسور را نشان دهد. برای جزئیات بیشتر، گزارش فنی ما را ببینید.

ویرایش این صفحه - این ترجمه را بهبود دهید - پیشنهاد بازخورد - لینک دائمی