source/libvpx/vp9/encoder/x86/vp9_dct_avx2.c - Issue 148913004: libvpx: Pull from upstream

Unified Diff: source/libvpx/vp9/encoder/x86/vp9_dct_avx2.c

Issue 148913004: libvpx: Pull from upstream (Closed) Base URL: svn://svn.chromium.org/chrome/trunk/deps/third_party/libvpx/

Patch Set: Created 6 years, 11 months ago

Use n/p to move between diff chunks; N/P to move between comments. Draft comments are only viewable by you.

Jump to:

View side-by-side diff with in-line comments

Download patch

Index: source/libvpx/vp9/encoder/x86/vp9_dct_avx2.c

===================================================================

--- source/libvpx/vp9/encoder/x86/vp9_dct_avx2.c (revision 247498)

+++ source/libvpx/vp9/encoder/x86/vp9_dct_avx2.c (working copy)

@@ -163,7 +163,7 @@

res[3] = _mm_unpackhi_epi64(res[2], res[2]);

}

-void fdct4_1d_avx2(__m128i *in) {

+void fdct4_avx2(__m128i *in) {

const __m128i k__cospi_p16_p16 = _mm_set1_epi16(cospi_16_64);

const __m128i k__cospi_p16_m16 = pair_set_epi16(cospi_16_64, -cospi_16_64);

const __m128i k__cospi_p08_p24 = pair_set_epi16(cospi_8_64, cospi_24_64);

@@ -196,7 +196,7 @@

transpose_4x4_avx2(in);

}

-void fadst4_1d_avx2(__m128i *in) {

+void fadst4_avx2(__m128i *in) {

const __m128i k__sinpi_p01_p02 = pair_set_epi16(sinpi_1_9, sinpi_2_9);

const __m128i k__sinpi_p04_m01 = pair_set_epi16(sinpi_4_9, -sinpi_1_9);

const __m128i k__sinpi_p03_p04 = pair_set_epi16(sinpi_3_9, sinpi_4_9);

@@ -250,20 +250,20 @@

load_buffer_4x4_avx2(input, in, stride);

switch (tx_type) {

case 0: // DCT_DCT

- fdct4_1d_avx2(in);

+ fdct4_avx2(in);

break;

case 1: // ADST_DCT

- fadst4_1d_avx2(in);

- fdct4_1d_avx2(in);

+ fadst4_avx2(in);

+ fdct4_avx2(in);

break;

case 2: // DCT_ADST

- fdct4_1d_avx2(in);

- fadst4_1d_avx2(in);

+ fdct4_avx2(in);

+ fadst4_avx2(in);

break;

case 3: // ADST_ADST

- fadst4_1d_avx2(in);

+ fadst4_avx2(in);

break;

default:

assert(0);

@@ -658,7 +658,7 @@

// 07 17 27 37 47 57 67 77

}

-void fdct8_1d_avx2(__m128i *in) {

+void fdct8_avx2(__m128i *in) {

// constants

const __m128i k__cospi_p16_p16 = _mm_set1_epi16(cospi_16_64);

const __m128i k__cospi_p16_m16 = pair_set_epi16(cospi_16_64, -cospi_16_64);

@@ -798,7 +798,7 @@

array_transpose_8x8_avx2(in, in);

}

-void fadst8_1d_avx2(__m128i *in) {

+void fadst8_avx2(__m128i *in) {

// Constants

const __m128i k__cospi_p02_p30 = pair_set_epi16(cospi_2_64, cospi_30_64);

const __m128i k__cospi_p30_m02 = pair_set_epi16(cospi_30_64, -cospi_2_64);

@@ -1034,20 +1034,20 @@

load_buffer_8x8_avx2(input, in, stride);

switch (tx_type) {

case 0: // DCT_DCT

- fdct8_1d_avx2(in);

+ fdct8_avx2(in);

break;

case 1: // ADST_DCT

- fadst8_1d_avx2(in);

- fdct8_1d_avx2(in);

+ fadst8_avx2(in);

+ fdct8_avx2(in);

break;

case 2: // DCT_ADST

- fdct8_1d_avx2(in);

- fadst8_1d_avx2(in);

+ fdct8_avx2(in);

+ fadst8_avx2(in);

break;

case 3: // ADST_ADST

- fadst8_1d_avx2(in);

+ fadst8_avx2(in);

break;

default:

assert(0);

@@ -1216,7 +1216,7 @@

step1_6 = _mm_sub_epi16(in01, in14);

step1_7 = _mm_sub_epi16(in00, in15);

}

- // Work on the first eight values; fdct8_1d(input, even_results);

+ // Work on the first eight values; fdct8(input, even_results);

{

// Add/substract

const __m128i q0 = _mm_add_epi16(input0, input7);

@@ -1730,7 +1730,7 @@

right_shift_8x8_avx2(res1 + 8, 2);

}

-void fdct16_1d_8col_avx2(__m128i *in) {

+void fdct16_8col_avx2(__m128i *in) {

// perform 16x16 1-D DCT for 8 columns

__m128i i[8], s[8], p[8], t[8], u[16], v[16];

const __m128i k__cospi_p16_p16 = _mm_set1_epi16(cospi_16_64);

@@ -2052,7 +2052,7 @@

in[15] = _mm_packs_epi32(v[14], v[15]);

}

-void fadst16_1d_8col_avx2(__m128i *in) {

+void fadst16_8col_avx2(__m128i *in) {

// perform 16x16 1-D ADST for 8 columns

__m128i s[16], x[16], u[32], v[32];

const __m128i k__cospi_p01_p31 = pair_set_epi16(cospi_1_64, cospi_31_64);

@@ -2522,15 +2522,15 @@

in[15] = _mm_sub_epi16(kZero, s[1]);

}

-void fdct16_1d_avx2(__m128i *in0, __m128i *in1) {

- fdct16_1d_8col_avx2(in0);

- fdct16_1d_8col_avx2(in1);

+void fdct16_avx2(__m128i *in0, __m128i *in1) {

+ fdct16_8col_avx2(in0);

+ fdct16_8col_avx2(in1);

array_transpose_16x16_avx2(in0, in1);

}

-void fadst16_1d_avx2(__m128i *in0, __m128i *in1) {

- fadst16_1d_8col_avx2(in0);

- fadst16_1d_8col_avx2(in1);

+void fadst16_avx2(__m128i *in0, __m128i *in1) {

+ fadst16_8col_avx2(in0);

+ fadst16_8col_avx2(in1);

array_transpose_16x16_avx2(in0, in1);

}

@@ -2540,24 +2540,24 @@

load_buffer_16x16_avx2(input, in0, in1, stride);

switch (tx_type) {

case 0: // DCT_DCT

- fdct16_1d_avx2(in0, in1);

+ fdct16_avx2(in0, in1);

right_shift_16x16_avx2(in0, in1);

- fdct16_1d_avx2(in0, in1);

+ fdct16_avx2(in0, in1);

break;

case 1: // ADST_DCT

- fadst16_1d_avx2(in0, in1);

+ fadst16_avx2(in0, in1);

right_shift_16x16_avx2(in0, in1);

- fdct16_1d_avx2(in0, in1);

+ fdct16_avx2(in0, in1);

break;

case 2: // DCT_ADST

- fdct16_1d_avx2(in0, in1);

+ fdct16_avx2(in0, in1);

right_shift_16x16_avx2(in0, in1);

- fadst16_1d_avx2(in0, in1);

+ fadst16_avx2(in0, in1);

break;

case 3: // ADST_ADST

- fadst16_1d_avx2(in0, in1);

+ fadst16_avx2(in0, in1);

right_shift_16x16_avx2(in0, in1);

- fadst16_1d_avx2(in0, in1);

+ fadst16_avx2(in0, in1);

break;

default:

assert(0);

« no previous file with comments | « source/libvpx/vp9/encoder/vp9_writer.h ('k') | source/libvpx/vp9/encoder/x86/vp9_dct_sse2.c » ('j') | no next file with comments »