src/opts/SkNx_sse.h - Issue 2133413002: try to speed-up maprect + round2i + contains

Unified Diff: src/opts/SkNx_sse.h

Issue 2133413002: try to speed-up maprect + round2i + contains (Closed) Base URL: https://skia.googlesource.com/skia.git@master

Patch Set: add dox Created 4 years, 5 months ago

Use n/p to move between diff chunks; N/P to move between comments. Draft comments are only viewable by you.

Jump to:

View side-by-side diff with in-line comments

Download patch

Index: src/opts/SkNx_sse.h

diff --git a/src/opts/SkNx_sse.h b/src/opts/SkNx_sse.h

deleted file mode 100644

index 65d9873c5c407c780903e3e6ae4fb1a3ccc89d1e..0000000000000000000000000000000000000000

--- a/src/opts/SkNx_sse.h

+++ /dev/null

@@ -1,374 +0,0 @@

-/*

- *

- * Use of this source code is governed by a BSD-style license that can be

- * found in the LICENSE file.

- */

-#ifndef SkNx_sse_DEFINED

-#define SkNx_sse_DEFINED

-#include <immintrin.h>

-// This file may assume <= SSE2, but must check SK_CPU_SSE_LEVEL for anything more recent.

-// If you do, make sure this is in a static inline function... anywhere else risks violating ODR.

-#define SKNX_IS_FAST

-template <>

-class SkNx<2, float> {

-public:

- SkNx(const __m128& vec) : fVec(vec) {}

- SkNx() {}

- SkNx(float val) : fVec(_mm_set1_ps(val)) {}

- static SkNx Load(const void* ptr) {

- return _mm_castsi128_ps(_mm_loadl_epi64((const __m128i*)ptr));

- }

- SkNx(float a, float b) : fVec(_mm_setr_ps(a,b,0,0)) {}

- void store(void* ptr) const { _mm_storel_pi((__m64*)ptr, fVec); }

- SkNx operator + (const SkNx& o) const { return _mm_add_ps(fVec, o.fVec); }

- SkNx operator - (const SkNx& o) const { return _mm_sub_ps(fVec, o.fVec); }

- SkNx operator * (const SkNx& o) const { return _mm_mul_ps(fVec, o.fVec); }

- SkNx operator / (const SkNx& o) const { return _mm_div_ps(fVec, o.fVec); }

- SkNx operator == (const SkNx& o) const { return _mm_cmpeq_ps (fVec, o.fVec); }

- SkNx operator != (const SkNx& o) const { return _mm_cmpneq_ps(fVec, o.fVec); }

- SkNx operator < (const SkNx& o) const { return _mm_cmplt_ps (fVec, o.fVec); }

- SkNx operator > (const SkNx& o) const { return _mm_cmpgt_ps (fVec, o.fVec); }

- SkNx operator <= (const SkNx& o) const { return _mm_cmple_ps (fVec, o.fVec); }

- SkNx operator >= (const SkNx& o) const { return _mm_cmpge_ps (fVec, o.fVec); }

- static SkNx Min(const SkNx& l, const SkNx& r) { return _mm_min_ps(l.fVec, r.fVec); }

- static SkNx Max(const SkNx& l, const SkNx& r) { return _mm_max_ps(l.fVec, r.fVec); }

- SkNx sqrt() const { return _mm_sqrt_ps (fVec); }

- SkNx rsqrt() const { return _mm_rsqrt_ps(fVec); }

- SkNx invert() const { return _mm_rcp_ps(fVec); }

- float operator[](int k) const {

- SkASSERT(0 <= k && k < 2);

- union { __m128 v; float fs[4]; } pun = {fVec};

- return pun.fs[k&1];

- }

- bool allTrue() const { return 0xff == (_mm_movemask_epi8(_mm_castps_si128(fVec)) & 0xff); }

- bool anyTrue() const { return 0x00 != (_mm_movemask_epi8(_mm_castps_si128(fVec)) & 0xff); }

- __m128 fVec;

-};

-template <>

-class SkNx<4, float> {

-public:

- SkNx(const __m128& vec) : fVec(vec) {}

- SkNx() {}

- SkNx(float val) : fVec( _mm_set1_ps(val) ) {}

- static SkNx Load(const void* ptr) { return _mm_loadu_ps((const float*)ptr); }

- SkNx(float a, float b, float c, float d) : fVec(_mm_setr_ps(a,b,c,d)) {}

- void store(void* ptr) const { _mm_storeu_ps((float*)ptr, fVec); }