مقایسه با الگوریتم درجه دوم پیاده سازی تنظیم شده الگوریتم G یک مشکل فرعی با اندازه ورودی 217 را در حدود 33.5 ثانیه روی یک هسته BlueGene/Q حل می کند. به منظور کامل بودن، آن را با اجرای بهینه الگوریتم درجه دوم خود مقایسه کردیم، که برای این مناسبت به Blue-Gene/Q منتقل کردیم. با کمی تنظیم و استفاده از 4 رشته سخت افزاری، عملکردی معادل 178 ثانیه در هر مشکل فرعی به دست می آوریم (234 جفت برای پردازش وجود دارد و هر جفت به 16 چرخه نیاز دارد). تعمیر لپ تاپ ایسر در اصفهان
بنابراین، اجرای بهینه الگوریتم G 5.3× سریعتر از الگوریتم درجه دوم در BlueGene/Q است - در واقع، الگوریتم درجه دوم از دستورالعمل های SIMD عدد صحیح موجود در CPUهای معمولی تر سود می برد اما در BlueGene/Q نه. 5.8. مدیریت محاسبات برای اطمینان از اینکه همه چیز طبق برنامه پیش می رود، کد خود را روی نمونه هایی با افزایش اندازه امتحان کردیم و بررسی کردیم که نتایج با انتظارات ما مطابقت دارند.
ما باید محاسبات یک میلیارد زیرمشکل مستقل را سازماندهی میکردیم که هر کدام به دادههای ورودی خود (تقریباً 5 مگابایت) نیاز دارند و برای حدود 30 ثانیه اجرا میشدند. ما وظایف را در یک شبکه دو بعدی مرتب کردیم: "وظیفه" ( , ) شامل حل مشکل فرعی ( , , ) است. چون 30 ثانیه است
مقایسه با الگوریتم درجه دوم پیاده سازی تنظیم شده الگوریتم G یک مشکل فرعی با اندازه ورودی 217 را در حدود 33.5 ثانیه روی یک هسته BlueGene/Q حل می کند. به منظور کامل بودن، آن را با اجرای بهینه الگوریتم درجه دوم خود مقایسه کردیم، که برای این مناسبت به Blue-Gene/Q منتقل کردیم. با کمی تنظیم و استفاده از 4 رشته سخت افزاری، عملکردی معادل 178 ثانیه در هر مشکل فرعی به دست می آوریم (234 جفت برای پردازش وجود دارد و هر جفت به 16 چرخه نیاز دارد).
بنابراین، اجرای بهینه الگوریتم G 5.3× سریعتر از الگوریتم درجه دوم در BlueGene/Q است - در واقع، الگوریتم درجه دوم از دستورالعمل های SIMD عدد صحیح موجود در CPUهای معمولی تر سود می برد تعمیر لپ تاپ ایسر در اصفهان اما در نه. مدیریت محاسبات برای اطمینان از اینکه همه چیز طبق برنامه پیش می رود، کد خود را روی نمونه هایی با افزایش اندازه امتحان کردیم و بررسی کردیم که نتایج با انتظارات ما مطابقت دارند.
ما باید محاسبات یک میلیارد زیرمشکل مستقل را سازماندهی میکردیم که هر کدام به دادههای ورودی خود (تقریباً 5 مگابایت) نیاز دارند و برای حدود 30 ثانیه اجرا میشدند. ما وظایف را در یک شبکه دو بعدی مرتب کردیم: "وظیفه" ( , ) شامل حل مشکل فرعی است. چون 30 ثانیه است