إرسال التسجيلة بالبريد الالكتروني: Compute-unified device architecture implementation of a block-matching algorithm for multiple graphical processing unit cards