realmar
/
Almond
forknuté z nicolas/Almond


			
				
					
						
						
							12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485
							#pragma OPENCL EXTENSION cl_khr_fp64 : enable

inline double2 twoSum(double a, double b) {
  double s = a + b;
  double bb = s - a;
  double e = (a - (s - bb)) + (b - bb);
  return (s, e);
}

inline double2 quickTwoSum(double a, double b) {
  double s = a + b;
  double e = b - (s - a);
  return (s, e);
}

inline double2 twoProd(double a, double b) {
//#ifdef QD_FMS
  double p = a * b;
  double e = fma(a, b, -p);
  return (p, e);
//#else
//  double a_hi, a_lo, b_hi, b_lo;
//  double p = a * b;
//  split(a, a_hi, a_lo);
//  split(b, b_hi, b_lo);
//  err = ((a_hi * b_hi - p) + a_hi * b_lo + a_lo * b_hi) + a_lo * b_lo;
//  return p;
//#endif
}

inline double2 mul(double2 a, double2 b) {
    double2 p = twoProd(a.0, b.0);
    p.1 += a.0 * b.1 + a.1 * b.0;
    return quickTwoSum(p.0, p.1);
}

inline double2 add(double2 a, double2 b) {
    double se = twoSum(a.0, b.0);
    se.1 += a.1 + b.1;
    return quickTwoSum(se.0, se.1);
}

inline double2 mulDouble(double2 a, double b) {
    double2 p = twoProd(a.0, b);
    p.1 += a.1 * b;
    return quickTwoSum(p.0, p.1);
}

__kernel void iterate(__global float* A, const int width,
                      double x1, double x2, double y1, double y2,
                      double pw1, double pw2, double ph1, double ph2, int max) {
   int index = get_global_id(0);
   int px = index % width;
   int py = index / width;

   double2 xl = (x1, x2);
   double2 yt = (y1, y2);
   double2 pixelScaleX = (pw1, pw2);
   double2 pixelScaleY = (ph1, ph2);

   double2 a = add(mulDouble(pixelScaleX, (double) px), xl); // pixelScaleX * px + xl
   double2 b = add(mulDouble(pixelScaleY, (double) py), yt) // pixelScaleY * py + yt
   double2 ca = a;
   double2 cb = b;

   int n = 0;
   while (n < max - 1) {
       double2 aa = mul(a, a);
       double2 bb = mul(b, b);
       double2 ab = mul(a, b);
       if (aa.0 + aa.1 + bb.0 + bb.1 > 16) break;
       double2 minusbb = (-bb.0, -bb.1)
       a = add(add(aa, minusbb), ca);
       double2 halfb = add(ab + cb);
       b = add(halfb, halfb);
       n++;
   }
// N + 1 - log (log  |Z(N)|) / log 2
   if (n >= max - 1)
       A[index] = max;
   else
       A[index] = ((float)n);
//               A[index] = ((float)n) + 1 - (a * a + b * b - 16) / (256 - 16);
//           A[get_global_id(0)] = 5;
};