test: modify test cases (#29383)

Signed-off-by: nico <cheng.yuan@zilliz.com>
2023-12-22 09:58:43 +08:00 · 2023-12-22 09:58:43 +08:00 · e75467dbf7
parent 2f434130f0
commit e75467dbf7
3 changed files with 51 additions and 19 deletions
--- a/tests/python_client/testcases/test_insert.py
+++ b/tests/python_client/testcases/test_insert.py
@ -1424,6 +1424,29 @@ class TestInsertInvalid(TestcaseBase):
        collection_w.insert(data, check_task=CheckTasks.err_res,
                            check_items={ct.err_code: 1, ct.err_msg: "Field varchar don't match in entities[0]"})

+    @pytest.mark.tags(CaseLabel.L2)
+    def test_insert_with_nan_value(self):
+        """
+        target: test insert with nan value
+        method: insert with nan value: None, float('nan'), np.NAN/np.nan, float('inf')
+        expected: raise exception
+        """
+        vector_field = ct.default_float_vec_field_name
+        collection_name = cf.gen_unique_str(prefix)
+        collection_w = self.init_collection_wrap(name=collection_name)
+        data = cf.gen_default_dataframe_data()
+        data[vector_field][0][0] = None
+        error = {ct.err_code: 1, ct.err_msg: "The data in the same column must be of the same type."}
+        collection_w.insert(data=data, check_task=CheckTasks.err_res, check_items=error)
+        data[vector_field][0][0] = float('nan')
+        error = {ct.err_code: 65535, ct.err_msg: "value 'NaN' is not a number or infinity"}
+        collection_w.insert(data=data, check_task=CheckTasks.err_res, check_items=error)
+        data[vector_field][0][0] = np.NAN
+        collection_w.insert(data=data, check_task=CheckTasks.err_res, check_items=error)
+        data[vector_field][0][0] = float('inf')
+        error = {ct.err_code: 65535, ct.err_msg: "value '+Inf' is not a number or infinity"}
+        collection_w.insert(data=data, check_task=CheckTasks.err_res, check_items=error)
+

 class TestInsertInvalidBinary(TestcaseBase):
    """
--- a/tests/python_client/testcases/test_query.py
+++ b/tests/python_client/testcases/test_query.py
@ -874,60 +874,68 @@ class TestQueryParams(TestcaseBase):
        expected: succeed
        """
        # 1. initialize with data
+        nb = ct.default_nb
+        pk_field = ct.default_int64_field_name
        collection_w = self.init_collection_general(prefix, enable_dynamic_field=True)[0]

        # 2. insert data
        array = cf.gen_default_rows_data(with_json=False)
-        limit = 10
-        for i in range(ct.default_nb):
-            array[i]["listInt"] = [m for m in range(i, i + limit)]  # test for int
-            array[i]["listStr"] = [str(m) for m in range(i, i + limit)]  # test for string
-            array[i]["listFlt"] = [m * 1.0 for m in range(i, i + limit)]  # test for float
-            array[i]["listBool"] = [bool(i % 2)]  # test for bool
-            array[i]["listList"] = [[i, str(i + 1)], [i * 1.0, i + 1]]  # test for list
-            array[i]["listMix"] = [i, i * 1.1, str(i), bool(i % 2), [i, str(i)]]  # test for mixed data
+        limit = random.randint(10, 20)
+        int_data = [[m for m in range(i, i + limit)] for i in range(nb)]
+        str_data = [[str(m) for m in range(i, i + limit)] for i in range(nb)]
+        flt_data = [[m * 1.0 for m in range(i, i + limit)] for i in range(nb)]
+        bool_data = [[bool(i % 2)] for i in range(nb)]
+        list_data = [[[i, str(i + 1)], [i * 1.0, i + 1]] for i in range(nb)]
+        mix_data = [[i, i * 1.1, str(i), bool(i % 2), [i, str(i)]] for i in range(nb)]
+        for i in range(nb):
+            array[i]["listInt"] = int_data[i]  # test for int
+            array[i]["listStr"] = str_data[i]  # test for string
+            array[i]["listFlt"] = flt_data[i]  # test for float
+            array[i]["listBool"] = bool_data[i]  # test for bool
+            array[i]["listList"] = list_data[i]  # test for list
+            array[i]["listMix"] = mix_data[i]  # test for mixed data

        collection_w.insert(array)

        # 3. query
        collection_w.load()

+        _id = random.randint(limit, nb - limit)
        # test for int
-        _id = random.randint(limit, ct.default_nb - limit)
        ids = [i for i in range(_id, _id + limit)]
        expression = f"{expr_prefix}(listInt, {ids})"
        res = collection_w.query(expression)[0]
-        assert len(res) == 2 * limit - 1
+        assert [entity[pk_field] for entity in res] == cf.assert_json_contains(expression, int_data)

        # test for string
        ids = [str(_id), str(_id + 1), str(_id + 2)]
        expression = f"{expr_prefix}(listStr, {ids})"
        res = collection_w.query(expression)[0]
-        assert len(res) == limit + len(ids) - 1
+        assert [entity[pk_field] for entity in res] == cf.assert_json_contains(expression, str_data)

        # test for float
        ids = [_id * 1.0]
        expression = f"{expr_prefix}(listFlt, {ids})"
-        res = collection_w.query(expression, output_fields=["count(*)"])[0]
-        assert res[0]["count(*)"] == limit
+        res = collection_w.query(expression)[0]
+        assert [entity[pk_field] for entity in res] == cf.assert_json_contains(expression, flt_data)

        # test for bool
        ids = [True]
        expression = f"{expr_prefix}(listBool, {ids})"
        res = collection_w.query(expression)[0]
-        assert len(res) == ct.default_nb // 2
+        assert [entity[pk_field] for entity in res] == cf.assert_json_contains(expression, bool_data)

        # test for list
        ids = [[_id, str(_id + 1)]]
        expression = f"{expr_prefix}(listList, {ids})"
-        res = collection_w.query(expression)[0]
-        assert len(res) == 1
+        res = collection_w.query(expression, output_fields=["count(*)"])[0]
+        assert res[0]["count(*)"] == 1

        # test for mixed data
-        ids = [_id * 1.1, bool(_id % 2)]
+        ids = [str(_id)]
        expression = f"{expr_prefix}(listMix, {ids})"
-        res = collection_w.query(expression)[0]
-        assert len(res) == ct.default_nb // 2
+        res = collection_w.query(expression, output_fields=["count(*)"])[0]
+        assert res[0]["count(*)"] == 1

    @pytest.mark.tags(CaseLabel.L2)
    @pytest.mark.parametrize("expr_prefix", ["json_contains_any", "json_contains_all"])
--- a/tests/python_client/testcases/test_search.py
+++ b/tests/python_client/testcases/test_search.py
@ -7597,6 +7597,7 @@ class TestCollectionRangeSearch(TestcaseBase):
                                rel_tol=0, abs_tol=abs_tol)

    @pytest.mark.tags(CaseLabel.L2)
+    @pytest.mark.skip("known issue #27518")
    def test_range_search_with_expression_large(self, dim):
        """
        target: test range search with large expression