src/opts/SkBlitMask_opts.h - Issue 1312763009: Restore old NEON blit_mask_d32_a8 methods.

Side by Side Diff: src/opts/SkBlitMask_opts.h

Issue 1312763009: Restore old NEON blit_mask_d32_a8 methods. (Closed) Base URL: https://skia.googlesource.com/skia.git@master

Patch Set: Created 5 years, 3 months ago

Use n/p to move between diff chunks; N/P to move between comments. Draft comments are only viewable by you.

Jump to:

View unified diff | Download patch

OLD	NEW
1 /*	1 /*

2 * Copyright 2015 Google Inc.	2 * Copyright 2015 Google Inc.

3 *	3 *

4 * Use of this source code is governed by a BSD-style license that can be	4 * Use of this source code is governed by a BSD-style license that can be

5 * found in the LICENSE file.	5 * found in the LICENSE file.

6 */	6 */

7	7

8 #ifndef SkBlitMask_opts_DEFINED	8 #ifndef SkBlitMask_opts_DEFINED

9 #define SkBlitMask_opts_DEFINED	9 #define SkBlitMask_opts_DEFINED

10	10

11 #include "Sk4px.h"	11 #include "Sk4px.h"

12	12

13 namespace SK_OPTS_NS {	13 namespace SK_OPTS_NS {

14	14

15 static void blit_mask_d32_a8_general(SkPMColor* dst, size_t dstRB,	15 #if defined(SK_ARM_HAS_NEON)

16 const SkAlpha* mask, size_t maskRB,	16 // The Sk4px versions below will work fine with NEON, but we have had many i ndications

17 SkColor color, int w, int h) {	17 // that it doesn't perform as well as this NEON-specific code. TODO(mtklein ): why?

18 auto s = Sk4px::DupPMColor(SkPreMultiplyColor(color));	18 #include "SkColor_opts_neon.h"

19 auto fn = [&](const Sk4px& d, const Sk4px& aa) {	19

20 // = (s + d(1-sa))aa + d(1-aa)	20 template <bool isColor>

21 // = saa + d(1-saaa)	21 static void D32_A8_Opaque_Color_neon(void* SK_RESTRICT dst, size_t dstRB,

22 auto left = s.approxMulDiv255(aa),	22 const void* SK_RESTRICT maskPtr, size_t maskRB,

23 right = d.approxMulDiv255(left.alphas().inv());	23 SkColor color, int width, int height) {

24 return left + right; // This does not overflow (exhaustively checked).	24 SkPMColor pmc = SkPreMultiplyColor(color);

25 };	25 SkPMColor* SK_RESTRICT device = (SkPMColor*)dst;

26 while (h --> 0) {	26 const uint8_t* SK_RESTRICT mask = (const uint8_t*)maskPtr;

27 Sk4px::MapDstAlpha(w, dst, mask, fn);	27 uint8x8x4_t vpmc;

28 dst += dstRB / sizeof(*dst);	28

29 mask += maskRB / sizeof(*mask);	29 maskRB -= width;

	30 dstRB -= (width << 2);

	31

	32 if (width >= 8) {

	33 vpmc.val[NEON_A] = vdup_n_u8(SkGetPackedA32(pmc));

	34 vpmc.val[NEON_R] = vdup_n_u8(SkGetPackedR32(pmc));

	35 vpmc.val[NEON_G] = vdup_n_u8(SkGetPackedG32(pmc));

	36 vpmc.val[NEON_B] = vdup_n_u8(SkGetPackedB32(pmc));

	37 }

	38 do {

	39 int w = width;

	40 while (w >= 8) {

	41 uint8x8_t vmask = vld1_u8(mask);

	42 uint16x8_t vscale, vmask256 = SkAlpha255To256_neon8(vmask);

	43 if (isColor) {

	44 vscale = vsubw_u8(vdupq_n_u16(256),

	45 SkAlphaMul_neon8(vpmc.val[NEON_A], vmask256));

	46 } else {

	47 vscale = vsubw_u8(vdupq_n_u16(256), vmask);

	48 }

	49 uint8x8x4_t vdev = vld4_u8((uint8_t*)device);

	50

	51 vdev.val[NEON_A] = SkAlphaMul_neon8(vpmc.val[NEON_A], vmask256 )

	52 + SkAlphaMul_neon8(vdev.val[NEON_A], vscale);

	53 vdev.val[NEON_R] = SkAlphaMul_neon8(vpmc.val[NEON_R], vmask256 )

	54 + SkAlphaMul_neon8(vdev.val[NEON_R], vscale);

	55 vdev.val[NEON_G] = SkAlphaMul_neon8(vpmc.val[NEON_G], vmask256 )

	56 + SkAlphaMul_neon8(vdev.val[NEON_G], vscale);

	57 vdev.val[NEON_B] = SkAlphaMul_neon8(vpmc.val[NEON_B], vmask256 )

	58 + SkAlphaMul_neon8(vdev.val[NEON_B], vscale);

	59

	60 vst4_u8((uint8_t*)device, vdev);

	61

	62 mask += 8;

	63 device += 8;

	64 w -= 8;

	65 }

	66

	67 while (w--) {

	68 unsigned aa = *mask++;

	69 if (isColor) {

	70 device = SkBlendARGB32(pmc, device, aa);

	71 } else {

	72 *device = SkAlphaMulQ(pmc, SkAlpha255To256(aa))

	73 + SkAlphaMulQ(*device, SkAlpha255To256(255 - aa));

	74 }

	75 device += 1;

	76 };

	77

	78 device = (uint32_t)((char)device + dstRB);

	79 mask += maskRB;

	80

	81 } while (--height != 0);

30 }	82 }

31 }

32	83

33 // As above, but made slightly simpler by requiring that color is opaque.	84 static void blit_mask_d32_a8_general(SkPMColor* dst, size_t dstRB,

34 static void blit_mask_d32_a8_opaque(SkPMColor* dst, size_t dstRB,	85 const SkAlpha* mask, size_t maskRB,

35 const SkAlpha* mask, size_t maskRB,	86 SkColor color, int w, int h) {

36 SkColor color, int w, int h) {	87 D32_A8_Opaque_Color_neon<true>(dst, dstRB, mask, maskRB, color, w, h);

37 SkASSERT(SkColorGetA(color) == 0xFF);

38 auto s = Sk4px::DupPMColor(SkPreMultiplyColor(color));

39 auto fn = [&](const Sk4px& d, const Sk4px& aa) {

40 // = (s + d(1-sa))aa + d(1-aa)

41 // = saa + d(1-saaa)

42 // ~~~>

43 // = s*aa + d(1-aa)

44 return s.approxMulDiv255(aa) + d.approxMulDiv255(aa.inv());

45 };

46 while (h --> 0) {

47 Sk4px::MapDstAlpha(w, dst, mask, fn);

48 dst += dstRB / sizeof(*dst);

49 mask += maskRB / sizeof(*mask);

50 }	88 }

51 }

52	89

53 // Same as _opaque, but assumes color == SK_ColorBLACK, a very common and even s impler case.	90 // As above, but made slightly simpler by requiring that color is opaque.

54 static void blit_mask_d32_a8_black(SkPMColor* dst, size_t dstRB,	91 static void blit_mask_d32_a8_opaque(SkPMColor* dst, size_t dstRB,

55 const SkAlpha* mask, size_t maskRB,	92 const SkAlpha* mask, size_t maskRB,

56 int w, int h) {	93 SkColor color, int w, int h) {

57 auto fn = [](const Sk4px& d, const Sk4px& aa) {	94 D32_A8_Opaque_Color_neon<false>(dst, dstRB, mask, maskRB, color, w, h);

58 // = (s + d(1-sa))aa + d(1-aa)

59 // = saa + d(1-saaa)

60 // ~~~>

61 // a = 1aa + d(1-1aa) = aa + d(1-aa)

62 // c = 0aa + d(1-1aa) = d(1-aa)

63 return aa.zeroColors() + d.approxMulDiv255(aa.inv());

64 };

65 while (h --> 0) {

66 Sk4px::MapDstAlpha(w, dst, mask, fn);

67 dst += dstRB / sizeof(*dst);

68 mask += maskRB / sizeof(*mask);

69 }	95 }

70 }	96

	97 // Same as _opaque, but assumes color == SK_ColorBLACK, a very common and ev en simpler case.

	98 static void blit_mask_d32_a8_black(SkPMColor* dst, size_t dstRB,

	99 const SkAlpha* maskPtr, size_t maskRB,

	100 int width, int height) {

	101 SkPMColor* SK_RESTRICT device = (SkPMColor*)dst;

	102 const uint8_t* SK_RESTRICT mask = (const uint8_t*)maskPtr;

	103

	104 maskRB -= width;

	105 dstRB -= (width << 2);

	106 do {

	107 int w = width;

	108 while (w >= 8) {

	109 uint8x8_t vmask = vld1_u8(mask);

	110 uint16x8_t vscale = vsubw_u8(vdupq_n_u16(256), vmask);

	111 uint8x8x4_t vdevice = vld4_u8((uint8_t*)device);

	112

	113 vdevice = SkAlphaMulQ_neon8(vdevice, vscale);

	114 vdevice.val[NEON_A] += vmask;

	115

	116 vst4_u8((uint8_t*)device, vdevice);

	117

	118 mask += 8;

	119 device += 8;

	120 w -= 8;

	121 }

	122 while (w-- > 0) {

	123 unsigned aa = *mask++;

	124 *device = (aa << SK_A32_SHIFT)

	125 + SkAlphaMulQ(*device, SkAlpha255To256(255 - aa));

	126 device += 1;

	127 };

	128 device = (uint32_t)((char)device + dstRB);

	129 mask += maskRB;

	130 } while (--height != 0);

	131 }

	132

	133 #else

	134 static void blit_mask_d32_a8_general(SkPMColor* dst, size_t dstRB,

	135 const SkAlpha* mask, size_t maskRB,

	136 SkColor color, int w, int h) {

	137 auto s = Sk4px::DupPMColor(SkPreMultiplyColor(color));

	138 auto fn = [&](const Sk4px& d, const Sk4px& aa) {

	139 // = (s + d(1-sa))aa + d(1-aa)

	140 // = saa + d(1-saaa)

	141 auto left = s.approxMulDiv255(aa),

	142 right = d.approxMulDiv255(left.alphas().inv());

	143 return left + right; // This does not overflow (exhaustively checke d).

	144 };

	145 while (h --> 0) {

	146 Sk4px::MapDstAlpha(w, dst, mask, fn);

	147 dst += dstRB / sizeof(*dst);

	148 mask += maskRB / sizeof(*mask);

	149 }

	150 }

	151

	152 // As above, but made slightly simpler by requiring that color is opaque.

	153 static void blit_mask_d32_a8_opaque(SkPMColor* dst, size_t dstRB,

	154 const SkAlpha* mask, size_t maskRB,

	155 SkColor color, int w, int h) {

	156 SkASSERT(SkColorGetA(color) == 0xFF);

	157 auto s = Sk4px::DupPMColor(SkPreMultiplyColor(color));

	158 auto fn = [&](const Sk4px& d, const Sk4px& aa) {

	159 // = (s + d(1-sa))aa + d(1-aa)

	160 // = saa + d(1-saaa)

	161 // ~~~>

	162 // = s*aa + d(1-aa)

	163 return s.approxMulDiv255(aa) + d.approxMulDiv255(aa.inv());

	164 };

	165 while (h --> 0) {

	166 Sk4px::MapDstAlpha(w, dst, mask, fn);

	167 dst += dstRB / sizeof(*dst);

	168 mask += maskRB / sizeof(*mask);

	169 }

	170 }

	171

	172 // Same as _opaque, but assumes color == SK_ColorBLACK, a very common and ev en simpler case.

	173 static void blit_mask_d32_a8_black(SkPMColor* dst, size_t dstRB,

	174 const SkAlpha* mask, size_t maskRB,

	175 int w, int h) {

	176 auto fn = [](const Sk4px& d, const Sk4px& aa) {

	177 // = (s + d(1-sa))aa + d(1-aa)

	178 // = saa + d(1-saaa)

	179 // ~~~>

	180 // a = 1aa + d(1-1aa) = aa + d(1-aa)

	181 // c = 0aa + d(1-1aa) = d(1-aa)

	182 return aa.zeroColors() + d.approxMulDiv255(aa.inv());

	183 };

	184 while (h --> 0) {

	185 Sk4px::MapDstAlpha(w, dst, mask, fn);

	186 dst += dstRB / sizeof(*dst);

	187 mask += maskRB / sizeof(*mask);

	188 }

	189 }

	190 #endif

71	191

72 static void blit_mask_d32_a8(SkPMColor* dst, size_t dstRB,	192 static void blit_mask_d32_a8(SkPMColor* dst, size_t dstRB,

73 const SkAlpha* mask, size_t maskRB,	193 const SkAlpha* mask, size_t maskRB,

74 SkColor color, int w, int h) {	194 SkColor color, int w, int h) {

75 if (color == SK_ColorBLACK) {	195 if (color == SK_ColorBLACK) {

76 blit_mask_d32_a8_black(dst, dstRB, mask, maskRB, w, h);	196 blit_mask_d32_a8_black(dst, dstRB, mask, maskRB, w, h);

77 } else if (SkColorGetA(color) == 0xFF) {	197 } else if (SkColorGetA(color) == 0xFF) {

78 blit_mask_d32_a8_opaque(dst, dstRB, mask, maskRB, color, w, h);	198 blit_mask_d32_a8_opaque(dst, dstRB, mask, maskRB, color, w, h);

79 } else {	199 } else {

80 blit_mask_d32_a8_general(dst, dstRB, mask, maskRB, color, w, h);	200 blit_mask_d32_a8_general(dst, dstRB, mask, maskRB, color, w, h);

81 }	201 }

82 }	202 }

83	203

84 } // SK_OPTS_NS	204 } // SK_OPTS_NS

85	205

86 #endif//SkBlitMask_opts_DEFINED	206 #endif//SkBlitMask_opts_DEFINED

OLD	NEW

« no previous file with comments | « no previous file | no next file » | no next file with comments »