chrome/browser/search_engines/template_url.cc - Issue 12623029: Upstreaming mechanism to add query refinement to omnibox searches.

Unified Diff: chrome/browser/search_engines/template_url.cc

Issue 12623029: Upstreaming mechanism to add query refinement to omnibox searches. (Closed) Base URL: svn://svn.chromium.org/chrome/trunk/src

Patch Set: Fixed ChromeOS. Created 7 years, 9 months ago

Use n/p to move between diff chunks; N/P to move between comments. Draft comments are only viewable by you.

Jump to:

View side-by-side diff with in-line comments

Download patch

« chrome/browser/search_engines/template_url.h ('K') | « chrome/browser/search_engines/template_url.h ('k') | chrome/browser/search_engines/template_url_unittest.cc » ('j') | chrome/browser/ui/webui/omnibox/omnibox_ui_handler.cc » ('J')
Expand Comments ('e') | Collapse Comments ('c') | Hide Comments ('s')

Index: chrome/browser/search_engines/template_url.cc

diff --git a/chrome/browser/search_engines/template_url.cc b/chrome/browser/search_engines/template_url.cc

index 974426b041c9e4c3cc58b512d39ddb06b4e90d2e..823f532fd4af0ec170659f7aeff66958cf88a778 100644

--- a/chrome/browser/search_engines/template_url.cc

+++ b/chrome/browser/search_engines/template_url.cc

@@ -237,28 +237,11 @@ std::string TemplateURLRef::ReplaceSearchTermsUsingTermsData(

}

+ std::string input_encoding;

string16 encoded_terms;

string16 encoded_original_query;

- std::string input_encoding;

- // Encode the search terms so that we know the encoding.

- for (std::vector<std::string>::const_iterator i(

- owner_->input_encodings().begin());

- i != owner_->input_encodings().end(); ++i) {

- if (TryEncoding(search_terms_args.search_terms,

- search_terms_args.original_query, i->c_str(),

- is_in_query, &encoded_terms, &encoded_original_query)) {

- input_encoding = *i;

- break;

- }

- if (input_encoding.empty()) {

- input_encoding = "UTF-8";

- if (!TryEncoding(search_terms_args.search_terms,

- search_terms_args.original_query,

- input_encoding.c_str(), is_in_query, &encoded_terms,

- &encoded_original_query))

- NOTREACHED();

- }

+ owner_->EncodeSearchTerms(search_terms_args, is_in_query, &input_encoding,

+ &encoded_terms, &encoded_original_query);

std::string url = parsed_url_;

@@ -472,7 +455,9 @@ bool TemplateURLRef::HasGoogleBaseURLs() const {

bool TemplateURLRef::ExtractSearchTermsFromURL(

const GURL& url,

string16* search_terms,

- const SearchTermsData& search_terms_data) const {

+ const SearchTermsData& search_terms_data,

+ url_parse::Parsed::ComponentType* search_terms_location,

+ url_parse::Component* search_terms_position) const {

DCHECK(search_terms);

search_terms->clear();

@@ -514,6 +499,10 @@ bool TemplateURLRef::ExtractSearchTermsFromURL(

net::UnescapeRule::URL_SPECIAL_CHARS |

net::UnescapeRule::REPLACE_PLUS_WITH_SPACE,

NULL);

+ if (search_terms_location)

+ *search_terms_location = search_term_key_location_;

+ if (search_terms_position)

+ *search_terms_position = value;

return true;

}

@@ -844,27 +833,10 @@ bool TemplateURL::ExtractSearchTermsFromURLUsingTermsData(

const GURL& url,

string16* search_terms,

const SearchTermsData& search_terms_data) {

- DCHECK(search_terms);

- search_terms->clear();

- // Then try to match with every pattern.

- for (size_t i = 0; i < URLCount(); ++i) {

- TemplateURLRef ref(this, i);

- if (ref.ExtractSearchTermsFromURL(url, search_terms, search_terms_data)) {

- // If ExtractSearchTermsFromURL() returns true and |search_terms| is empty

- // it means the pattern matched but no search terms were present. In this

- // case we fail immediately without looking for matches in subsequent

- // patterns. This means that given patterns

- // [ "http://foo/#q={searchTerms}", "http://foo/?q={searchTerms}" ],

- // calling ExtractSearchTermsFromURL() on "http://foo/?q=bar#q=' would

- // return false. This is important for at least Google, where such URLs

- // are invalid.

- return !search_terms->empty();

- }

- return false;

+ return FindSearchTermsInURL(url, search_terms_data, search_terms, NULL, NULL);

}

bool TemplateURL::IsSearchURL(const GURL& url) {

UIThreadSearchTermsData search_terms_data(profile_);

return IsSearchURLUsingTermsData(url, search_terms_data);

@@ -897,6 +869,81 @@ bool TemplateURL::HasSearchTermsReplacementKey(const GURL& url) const {

return false;

}

+bool TemplateURL::ReplaceSearchTermsInURL(

+ const GURL& url,

+ const TemplateURLRef::SearchTermsArgs& search_terms_args,

+ GURL* result) {

+ UIThreadSearchTermsData search_terms_data(profile_);

+ // TODO(beaudoin): Use AQS from |search_terms_args| too.

+ url_parse::Parsed::ComponentType search_term_location;

+ url_parse::Component search_terms_position;

+ string16 search_terms;

+ if (!FindSearchTermsInURL(url, search_terms_data, &search_terms,

+ &search_term_location, &search_terms_position))

Peter Kasting 2013/03/22 20:20:06 Nit: Lines of args should all be aligned. Indent

beaudoin 2013/03/22 23:10:43 Done.

+ return false;

+ DCHECK(search_terms_position.is_nonempty());

+ // FindSearchTermsInURL only returns true for search terms in the query or

+ // ref, so we can call EncodeSearchTerm with |is_in_query| = true, since query

+ // and ref are encoded in the same way.

+ std::string input_encoding;

+ string16 encoded_terms;

+ string16 encoded_original_query;

+ EncodeSearchTerms(search_terms_args, true, &input_encoding,

+ &encoded_terms, &encoded_original_query);

+ url_canon::StdStringReplacements<std::string> replacements;

+ std::string new_params;

+ switch (search_term_location) {

Peter Kasting 2013/03/22 20:20:06 This switch can be eliminated, and the function sh

beaudoin 2013/03/22 23:10:43 Done.

+ case url_parse::Parsed::QUERY:

+ new_params += url.query().substr(0, search_terms_position.begin);

+ new_params += UTF16ToUTF8(search_terms_args.search_terms);

+ new_params.append(url.query().substr(search_terms_position.begin +

+ search_terms_position.len));

+ replacements.SetQueryStr(new_params);

+ break;

+ case url_parse::Parsed::REF:

+ new_params = url.ref().substr(0, search_terms_position.begin);

+ new_params += UTF16ToUTF8(search_terms_args.search_terms);

+ new_params += url.ref().substr(search_terms_position.begin +

+ search_terms_position.len);

+ replacements.SetRefStr(new_params);

+ break;

+ default:

+ NOTREACHED();

+ }

+ *result = url.ReplaceComponents(replacements);

+ return true;

+void TemplateURL::EncodeSearchTerms(

+ const TemplateURLRef::SearchTermsArgs& search_terms_args,

+ bool is_in_query,

+ std::string* input_encoding,

+ string16* encoded_terms,

+ string16* encoded_original_query) const {

+ for (std::vector<std::string>::const_iterator i(input_encodings().begin());

+ i != input_encodings().end(); ++i) {

+ if (TryEncoding(search_terms_args.search_terms,

+ search_terms_args.original_query, i->c_str(),

+ is_in_query, encoded_terms, encoded_original_query)) {

+ *input_encoding = *i;

+ break;

+ }

+ if (input_encoding->empty()) {

Peter Kasting 2013/03/22 20:20:06 This last block can be avoided by rewriting the fu

beaudoin 2013/03/22 23:10:43 Done.

+ *input_encoding = "UTF-8";

+ if (!TryEncoding(search_terms_args.search_terms,

+ search_terms_args.original_query,

+ input_encoding->c_str(), is_in_query, encoded_terms,

+ encoded_original_query))

+ NOTREACHED();

+ }

void TemplateURL::CopyFrom(const TemplateURL& other) {

if (this == &other)

return;

@@ -930,3 +977,31 @@ void TemplateURL::ResetKeywordIfNecessary(bool force) {

data_.SetKeyword(TemplateURLService::GenerateKeyword(url));

}

+bool TemplateURL::FindSearchTermsInURL(

+ const GURL& url,

+ const SearchTermsData& search_terms_data,

+ string16* search_terms,

+ url_parse::Parsed::ComponentType* search_term_location,

+ url_parse::Component* search_terms_position) {

+ DCHECK(search_terms);

+ search_terms->clear();

+ // Try to match with every pattern.

+ for (size_t i = 0; i < URLCount(); ++i) {

+ TemplateURLRef ref(this, i);

+ if (ref.ExtractSearchTermsFromURL(url, search_terms, search_terms_data,

+ search_term_location, search_terms_position)) {

+ // If ExtractSearchTermsFromURL() returns true and |search_terms| is empty

+ // it means the pattern matched but no search terms were present. In this

+ // case we fail immediately without looking for matches in subsequent

+ // patterns. This means that given patterns

+ // [ "http://foo/#q={searchTerms}", "http://foo/?q={searchTerms}" ],

+ // calling ExtractSearchTermsFromURL() on "http://foo/?q=bar#q=' would

+ // return false. This is important for at least Google, where such URLs

+ // are invalid.

+ return !search_terms->empty();

+ }

+ return false;