calchistogram-Methodecalchistogram Method

Die calchistogram-Methode berechnet die Objekte, die einem strukturierten Abfrageausdruck entsprechen, und berechnet die Verteilung ihrer Attributwerte.The calchistogram method computes the objects matching a structured query expression and calculates the distribution of their attribute values.

AnforderungRequest

http://<host>/calchistogram?expr=<expr>[&options]

NAMEName WertValue BESCHREIBUNGDescription
exprexpr TextzeichenfolgeText string Strukturierter Abfrageausdruck, der die Indexentitäten angibt, über die Histogramme berechnet werden sollen.Structured query expression that specifies the index entities over which to calculate histograms.
attributesattributes Textzeichenfolge (default="")Text string (default="") Durch Trennzeichen getrennte Liste von Attributen, die in der Antwort enthalten sein sollen.Comma-delimited list of attribute to included in the response.
countcount Zahl (default=10)Number (default=10) Anzahl der zurückzugebenden Ergebnisse.Number of results to return.
offsetoffset Zahl (default=0)Number (default=0) Index des ersten zurückzugebenden Ergebnisses.Index of the first result to return.

Antwort (JSON)Response (JSON)

JSONPathJSONPath BESCHREIBUNGDescription
$.expr$.expr expr-Parameter aus der Anforderung.expr parameter from the request.
$.num_entities$.num_entities Gesamtanzahl der übereinstimmenden Entitäten.Total number of matching entities.
$.histograms$.histograms Ein Array von Histogrammen, eines für jedes angeforderte Attribut.Array of histograms, one for each requested attribute.
$.histograms[*].attribute$.histograms[*].attribute Der Name des Attributs, über das das Histogramm berechnet wurde.Name of the attribute over which the histogram was computed.
$.histograms[*].distinct_values$.histograms[*].distinct_values Die Anzahl der unterschiedlichen Werte unter den übereinstimmenden Entitäten für dieses Attribut.Number of distinct values among matching entities for this attribute.
$.histograms[*].total_count$.histograms[*].total_count Gesamtanzahl der Wertinstanzen unter den übereinstimmenden Entitäten für dieses Attribut.Total number of value instances among matching entities for this attribute.
$.histograms[*].histogram$.histograms[*].histogram Histogrammdaten für dieses Attribut.Histogram data for this attribute.
$.histograms[*].histogram[*].value$.histograms[*].histogram[*].value Attributwert.Attribute value.
$.histograms[*].histogram[*].logprob$.histograms[*].histogram[*].logprob Gesamtwahrscheinlichkeit natürlicher Logarithmen der übereinstimmenden Elemente bei diesem Attributwert.Total natural log probability of matching entities with this attribute value.
$.histograms[*].histogram[*].count$.histograms[*].histogram[*].count Die Anzahl der übereinstimmenden Entitäten bei diesem Attributwert.Number of matching entities with this attribute value.
$.aborted$.aborted „true“, wenn ein Timeout bei der Anforderung aufgetreten ist.True if the request timed out.

BeispielExample

Im Beispiel der wissenschaftlichen Veröffentlichungen berechnet die folgende Formel ein Histogramm zur Anzahl der Veröffentlichungen nach Jahr und Schlüsselwort für einen bestimmten Autor seit 2013:In the academic publications example, the following calculates a histogram of publication counts by year and by keyword for a particular author since 2013:

http://<host>/calchistogram?expr=And(Composite(Author.Name=='jaime teevan'),Year>=2013)&attributes=Year,Keyword&count=4

Die Antwort gibt an, dass es 37 Werke gibt, die dem Abfrageausdruck entsprechen.The response indicates that there are 37 papers matching the query expression. Für das Year-Attribut gibt es 3 unterschiedliche Werte; einen für jedes Jahr seit 2013.For the Year attribute, there are 3 distinct values, one for each year since 2013. Die Gesamtanzahl der Werke über die 3 unterschiedlichen Werte beträgt „37“.The total paper count over the 3 distinct values is 37. Für jedes Year-Attribut zeigt das Histogramm den Wert, die Gesamtwahrscheinlichkeit natürlicher Logarithmen und die Anzahl der übereinstimmenden Entitäten an.For each Year, the histogram shows the value, total natural log probability, and count of matching entities.

Das Histogramm für Keyword zeigt, dass es 34 verschiedene Schlüsselwörter gibt.The histogram for Keyword shows that there are 34 distinct keywords. Da ein Werk eventuell mehreren Schlüsselwörtern zugeordnet wird, kann die Gesamtanzahl (53) größer sein als die Anzahl der übereinstimmenden Entitäten.As a paper may be associated with multiple keywords, the total count (53) can be larger than the number of matching entities. Obwohl 34 unterschiedliche Werte vorhanden sind, enthält die Antwort aufgrund des „count=4“-Parameters nur die ersten 4.Although there are 34 distinct values, the response only includes the top 4 because of the "count=4" parameter.

{
  "expr": "And(Composite(Author.Name=='jaime teevan'),Y>=2013)",
  "num_entities": 37,
  "histograms": [
    {
      "attribute": "Y",
      "distinct_values": 3,
      "total_count": 37,
      "histogram": [
        {
          "value": 2014,
          "logprob": -6.894,
          "count": 15
        },
        {
          "value": 2013,
          "logprob": -6.927,
          "count": 12
        },
        {
          "value": 2015,
          "logprob": -7.082,
          "count": 10
        }
      ]
    },
    {
      "attribute": "Keyword",
      "distinct_values": 34,
      "total_count": 53,
      "histogram": [
        {
          "value": "crowdsourcing",
          "logprob": -7.142,
          "count": 9
        },
        {
          "value": "information retrieval",
          "logprob": -7.389,
          "count": 4
        },
        {
          "value": "personalization",
          "logprob": -7.623,
          "count": 3
        },
        {
          "value": "mobile search",
          "logprob": -7.674,
          "count": 2
        }
      ]
    }
  ]
}